본문 바로가기
728x90
반응형
SMALL

초급개발자6

(궁금) 페이지 랭크(PageRank) 알고리즘에 대해서 알아보자! 1. PageRank란?PageRank는 구글(Google)의 검색 엔진이 웹 페이지의 중요도를 평가하는 알고리즘으로, 링크 분석(Link Analysis) 기법을 활용하여 웹 페이지의 상대적인 가치를 결정한다.1996년 래리 페이지(Larry Page)와 세르게이 브린(Sergey Brin)이 스탠퍼드 대학에서 연구한 논문 *"The Anatomy of a Large-Scale Hypertextual Web Search Engine"*에서 처음 제안되었으며, 이후 구글 검색 엔진의 핵심 요소로 발전했다.2. PageRank의 기본 개념(1) 링크 기반 중요도 평가웹 페이지는 서로 하이퍼링크(🔗)로 연결되어 있다.A 페이지가 B 페이지에 링크를 건다면, A 페이지는 B 페이지에 추천(Vote)을 준 것.. 2025. 4. 2.
4. Retrieval-Augmented Generation (RAG): 대규모 언어 모델(LLM)과 정보 검색의 결합 1. RAG 개념 및 필요성1.1. 기존 LLM의 한계기존 대규모 언어 모델(LLM, Large Language Model)은 훈련된 데이터 내에서만 답변을 생성하는 폐쇄형(Closed-book) 모델입니다. 이는 최신 정보 반영이 어렵고, 훈련 데이터 외부의 새로운 사실을 포함하지 못하는 한계를 가집니다.1.2. RAG의 역할Retrieval-Augmented Generation(RAG)은 이러한 한계를 극복하기 위해 외부 정보 검색(Retrieval)과 생성(Generation) 단계를 결합한 프레임워크입니다. 이를 통해 LLM은 대규모 문서 데이터베이스나 인터넷과 같은 정보 원천에서 정확하고 최신의 데이터를 검색한 후, 이를 기반으로 응답을 생성할 수 있습니다.✅ 핵심 개념:Retrieval(정보 .. 2025. 4. 2.
(궁금) 시맨틱 검색(Semantic Search)와 코사인 유사도(Cosine Similarity)이란 뭘까? 시맨틱 검색은 문장의 의미적 유사성(Semantic Similarity)을 기반으로 검색을 수행하는 기법이다. 이는 전통적인 키워드 검색과 달리 단순한 단어 일치(matching) 방식이 아닌 문맥과 의미를 고려하는 방식이다. 이 과정에서 문장 임베딩(Sentence Embedding)을 생성하고, 이를 기반으로 벡터 검색(Vector Search)을 수행한다.이러한 시맨틱 검색의 핵심 요소 중 하나가 코사인 유사도(Cosine Similarity)이다. 코사인 유사도는 두 개의 벡터가 이루는 각도를 기반으로 유사성을 측정하는 방식으로, 텍스트 검색, 추천 시스템, 클러스터링, 정보 검색 등에 널리 활용된다.1. 코사인 유사도(Cosine Similarity)의 정의코사인 유사도는 두 벡터 사이의 각도를.. 2025. 4. 2.
(궁금) TF-IDF (Term Frequency-Inverse Document Frequency)가 뭘까 1. TF-IDF 개요TF-IDF(Term Frequency-Inverse Document Frequency)는 텍스트 마이닝(text mining) 및 자연어 처리(NLP, Natural Language Processing)에서 문서 내 특정 단어의 중요도를 평가하는 대표적인 방법입니다.이를 통해 자연어 문서에서 중요한 단어를 추출하고, 키워드를 선별하며, 문서 간 유사도를 측정하는 등의 다양한 응용이 가능합니다.📌 핵심 개념TF(Term Frequency, 단어 빈도): 문서 내 특정 단어가 얼마나 자주 등장하는지 측정IDF(Inverse Document Frequency, 역문서 빈도): 특정 단어가 전체 문서에서 얼마나 희귀한지를 평가2. TF-IDF 공식2.1. 기본 수식TF-IDF는 아래와 .. 2025. 4. 1.
[ONLY JAVA-File]하위폴더의 파일들을 이동시키고 일괄 이름변경 프로그램 개요 주로 사용된 기술과 스킬은 파일 이동,이름명 변경을 통해 파일의 기본적인 구조와 활용 이해 파일 클래스를 심화 응용 사용자 편의 및 프로젝트와 유사하게 기획 및 구현 내용 안녕하세요~! 지난 포스팅으로 연속적으로 파일을 다루는 자바 함수들을 이용해서 간단한 프로그램 2개를 만들어보았습니다! [상위폴더로 하위폴더의 파일들을 이동시키는 프로그램] https://uno-kim.tistory.com/390 [파일]특정 폴더 하위 폴더의 파일들을 이동시키는 프로그램 안녕하세요! 그 동안 제가 취미(??) 생활로 이것저것 수집을 좋아해서 수집활동을 꾸준히 하고있는데 웹상에서 떠돌고있는 폴더들을 크롤링 또는 다운로드를 특정 폴더에 받게끔하면 폴더안에 uno-kim.tistory.com [폴더안의 이름중 특정 구.. 2023. 8. 22.
MySQL 데이터베이스 설치 / MySQL 설치하기 안녕하세요~!!ㅎㅎㅎ 오늘은 MySQL 을 설치하는 방법에 대해서 메모성으로 글을 남겨보겠습니다. 그래도 이미지와 간단한 설명 위주로 등록해서 다른분들도 제 포스팅을 보면서 천천히 따라하신다면 성공적으로 설치 하실 수 있게 작성해보겠습니다!! 1. MySQL 다운로드 MySQL을 다운받기 위해서는 https://dev.mysql.com/downloads/file/?id=514051 MySQL :: Begin Your Download The world's most popular open source database Contact MySQL | Login | Register dev.mysql.com 에 접속하시고 다운받으셔야합니다. 2022년 11월 14일 기준으로 현재 페이지에 8.0.31 버전으로 설치해.. 2022. 11. 14.
728x90
반응형
LIST