LLM & RAG 용어정리 (Vector DB 와 RAG의 개념)
·
용어정리/LLM & RAG
LLM의 Vector DB와 RAG의 개념에 대해서 알아보자.Vertor DBVector DB는 벡터 형태로 저장된 데이터들이 모여있는 집합이다.일반적인 데이터베이스는 어떠한 입력에 대해서 정확하게 일치하는 데이터를 검색하지만,Vector DB는 임베딩을 통한 벡터화로 인하여 연관성을 가지고 있기 때문에,유사한 벡터 간의 검색을 지원 할 수 있다. Vector (벡터)텍스트 또는 이미지와 같은 비정형 데이터(구조가 없는 데이터)를 인베딩을 통해 벡터화 하여서 저장한다.이때의 벡터는 데이터의 의미나 특징을 포함하고 있기 때문에, 위에서 이야기한 유사한 벡터간의 검색이가능하도록 한다. Faiss벡터 검색 엔진이다. (Vector DB안의 기능이 아닌 Faiss또한 이 검색 엔진을 지원하는 Vector DB이..
LLM & RAG 용어정리 (LLM 사용 전 중요한 개념)
·
용어정리/LLM & RAG
LLM을 사용하기 전에 알아야 할 중요한 개념들에 대해서 알아보자. 보안 문제LLM을 사용할 때의 데이터 보안 문제가 생길 수 있다. 개인 정보 보호학습 데이터 또는 대화를 통하여 민감한 개인 정보가 포함이 될 수 있다.데이터 저장 및 전송LLM이 처리한 데이터가 어디에 저장되는지, 어디로 전송이 되는지를 알아야한다. 보안을 강화하는 방법민감한 정보 필터링입력된 데이터에서 민감한 정보를 자동으로 거르는 필터링 시스템을 구축 하는 방법.암호화SSL/TLS 와같은 데이터 암호화 프로토콜을 이용한다.SSL/TLS을 HTTP와 결합한 HTTPS를 사용한다.데이터 저장 최소화학습데이터가 아닌 유저의 데이터의 최소화를 뜻한다.데이터 보존 주기를 설정해 자동으로 삭제를 시키는등 유저의 정보를 지속적으로 정리해야한다...
LLM & RAG 용어정리 (RAG, Vector DB, LangChain)
·
용어정리/LLM & RAG
LLM 시스템 형성을 위한 다양한 기법 및 요소RAG, Vector DB, LangChain에 대해서 알아보자RAG  RAG는 Retrieval-Augmented Generation의 약자이다.단어 그대로인 검색 기반 생성 기법을 뜻한다. LLM의 한계인 많은 데이터를 학습했음에도 불구하고, 최신의 정보와 특정 전문적인 지식(도메인 지식)에 대하여 한계를 가질수 밖에 없다. 이를 보안하기 위해서 나온것이 RAG이다.  이는 LLM에서 답을 직접 생성하는것 대신, 외부의 데이터베이스 또는 문서등에서 관련된 정보를 검색하여그 검색한 정보들을 토대로 답변을 생성하는 방식이다.  동작 원리질문 입력사용자의 인풋을 질문으로 받아서, 질문에 맞는 답변을 위해 검색 단계를 거친다문서 검색백터 DB 나 기타 저장소 등..