llama index
https://x.com/llama_index/status/1729303619760259463?s=20
⭐️ Hybrid Fusion (vector + keyword search + reranking)
⭐️ Query Rewriting + Fusion
⭐️ Retrieval with embedded tables (using @UnstructuredIO)
⭐️ Auto-merging Retriever
⭐️ Sentence Window Retriever (retrieve on sentences, expand into chunks)
⭐️ Node Reference Retriever (retrieve on smaller chunks, expand into parent chunks)
⭐️ Multi-Document Agents (handles advanced queries)
https://github.com/run-llama/llama-hub/tree/main/llama_hub/llama_packs
평가:
RAG 를 쓰다보면, Retrieval 을 어떻게 하는지 궁금해진다. 필요한 문서를 넣었는데, 질문에 맞게 가져오질 못하는 경우가 꽤 있기 때문이다.
결국, DB 에서 Query Optimization 하는 식으로, 어떤 질문이냐에 따라서, 문서를 넣고 인덱싱하고 가져오는 방식도 달라져야 하는 것이다.
그림으로 각 케이스가 어떻게 달라지는지 직관적으로 와 닿지는 않는다.
질문을 했을 경우 어떻게 질문이 해석되고, 어떤 과정을 통해 조회되는지, 어떻게 응답이 합쳐지는 지를 아는 것은 매우 중요하다.
나의 도메인에서 자주 쓰는 질문에 대입해 보고, 맞는지를 미리 확인해 볼 수 있을 것이다.
7가지 경우의 패턴에 따라서 트라이 해보고, 좋은 결과를 얻을 수 있는지 테스트 해보면 될 것이다.
각 케이스에 최적화된 유스케이스가 궁금해진다.
댓글 없음:
댓글 쓰기