Site icon 유라클 블로그

개발자 툴박스에 AI 추가하기: 유라클의 RAG 학습 커리큘럼②

안녕하세요, 유라클 CTO입니다.

지난 1편에서는 AI 개발의 초석을 다질 수 있는 언어, 도구, LLM에 대한 학습 커리큘럼을 소개했었는데요. 이번 2편에서는 본격적으로 RAG(Retrieval-Augmented Generation) 서비스 구성을 위한 심화 학습 커리큘럼을 다뤄보겠습니다.

1편 핵심 요약

 

RAG: LLM 활용의 현실적인 대안

RAG는 검색(Retrieval) 과 생성(Generation)을 결합한 기술로 LLM의 한계를 극복하고 현실적인 문제 해결에 도움을 주는 솔루션으로 각광받고 있습니다.

RAG, 왜 주목받을까요?

현재로서는 RAG가 가장 현실적인 LLM 활용 방안이지만, LLM 기술이 더욱 발전하면 다른 기술이 주목받을 가능성도 있습니다. 예를 들어, LLM의 추론 능력이 향상되면 외부 지식 검색 없이도 정확한 답변을 생성할 수 있을지도 모릅니다. 하지만 당분간은 RAG가 핵심 기술로 자리 잡을 것으로 예상됩니다.

 

RAG 동작 원리, 이것만 알면 OK!

  1. 사용자 질문(Query) 입력: 사용자가 질문을 입력합니다.
  2. 질문 임베딩(Embedding): 질문을 벡터(숫자들의 나열)로 변환합니다.
  3. 문서 검색(Retrieval): 벡터 데이터베이스(Vector DB)에서 질문과 유사한 문서를 검색합니다.
  4. 문서 선택 및 순위 재조정(Re-ranking): 검색된 문서 중 가장 관련성이 높은 문서를 선택하고 순위를 재조정합니다.
  5. 답변 생성(Generation): 선택된 문서를 LLM에 입력으로 제공하여 답변을 생성합니다.
RAG 핵심 구성 요소 학습 커리큘럼

 

RAG 파이프라인: 조립하듯 착착!

RAG 파이프라인은 사용자 쿼리를 입력으로 받아 최종 답변을 생성하기까지의 과정을 단계별로 정의한 것입니다. 각 단계는 특정 역할을 수행하는 모듈로 구성됩니다.

RAG 파이프라인, 자세히 들여다보기
RAG 파이프라인 학습 커리큘럼

 

Embedding: RAG의 핵심 기술

임베딩 기초 및 원리 학습
LLM 기반 임베딩 모델 학습

 

Vector DB: 효율적인 검색을 위한 필수 요소

벡터 데이터베이스 기초 및 원리 학습
벡터 데이터베이스 인덱싱: 속도와 정확도를 높이는 기술
인덱스 원리, 설명, 인덱싱 전략 학습

 

Re-ranking: 검색 품질을 높이는 마지막 단계

Re-ranking, 이것만 알아도 충분!
심화 학습: 사전(Dictionary) 구성을 통한 RAG 전략

실제 업무에서는 도메인 특화 용어, 약어, 동의어 등을 효과적으로 처리하기 위해 사전을 구축하고 활용하는 것이 중요합니다.

 

정리하며

AI가 개발자를 대체할 것이라는 견해도 있지만, AI를 이용해 사람들에게 혜택을 주는 소프트웨어를 개발하는 일은 계속 존재할 것 같습니다. 따라서 개발자라면 AI, LLM, GenAI 등에 대해 항상 공부하고, 자신만의 툴박스에서 바로 꺼내어 쓸 수 있는 도구와 사용법을 챙겨두는 것이 필수 생존 기술이라는 생각이 듭니다.

공부할 내용이 무궁무진해서 두서없이 주욱 주제 중심으로 나열하기는 했습니다만, 새로운 영역에 도전하시는 Senior 개발자 선배님들, Junior 개발자 후배님들께 조금이라도 도움이 된다면 좋겠습니다. 유라클 기술 블로그에 앞으로도 많은 관심 부탁드립니다!

 

Exit mobile version