/rag-from-scratch

RAG 직접 구현하기 - 한국어 문서

Primary LanguageJupyter Notebook

RAG 직접 구현하기

LLM은 방대하지만 고정된 데이터셋으로 학습되기 때문에, 비공개 정보나 최신 정보를 다루는 데 한계가 있다. 파인튜닝은 이를 해결하는 한 가지 방법이지만, 사실 기반 정보 회상에는 적합하지 않을 수 있고, 비용이 많이 들 수 있다.
이런 문제를 해결하기 위해 최근 Retrieval Augmented Generation(RAG)이 주목받고 있다. RAG는 외부 데이터 소스에서 문서를 검색해 LLM의 생성 과정에 활용함으로써, 컨텍스트 학습을 통해 LLM의 지식 기반을 확장하는 강력한 메커니즘이다.
이 노트북은 RAG의 기본 개념부터 시작해 인덱싱, 검색, 생성의 원리를 단계별로 이해할 수 있도록 돕는 동영상 플레이리스트와 함께 제공된다.
rag_detail_v2

동영상 플레이리스트