Elliot's Super Computing Duper Programmer: LllamaPack

2023년 11월 28일 화요일

⭐️ Hybrid Fusion (vector + keyword search + reranking)

⭐️ Query Rewriting + Fusion

⭐️ Retrieval with embedded tables (using @UnstructuredIO)

⭐️ Auto-merging Retriever

⭐️ Sentence Window Retriever (retrieve on sentences, expand into chunks)

⭐️ Node Reference Retriever (retrieve on smaller chunks, expand into parent chunks)

⭐️ Multi-Document Agents (handles advanced queries)

RAG 를 쓰다보면, Retrieval 을 어떻게 하는지 궁금해진다. 필요한 문서를 넣었는데, 질문에 맞게 가져오질 못하는 경우가 꽤 있기 때문이다.

결국, DB 에서 Query Optimization 하는 식으로, 어떤 질문이냐에 따라서, 문서를 넣고 인덱싱하고 가져오는 방식도 달라져야 하는 것이다.

그림으로 각 케이스가 어떻게 달라지는지 직관적으로 와 닿지는 않는다.

질문을 했을 경우 어떻게 질문이 해석되고, 어떤 과정을 통해 조회되는지, 어떻게 응답이 합쳐지는 지를 아는 것은 매우 중요하다.

나의 도메인에서 자주 쓰는 질문에 대입해 보고, 맞는지를 미리 확인해 볼 수 있을 것이다.

7가지 경우의 패턴에 따라서 트라이 해보고, 좋은 결과를 얻을 수 있는지 테스트 해보면 될 것이다.

각 케이스에 최적화된 유스케이스가 궁금해진다.

Elliot's Super Computing Duper Programmer