一、基本RAG介紹

? ? ? ?基本RAG需要從外部知識數據庫中獲取文檔,然后,將這些文檔與用戶的查詢一起被傳輸到LLM,用于生成響應。從本質上講,RAG包括一個檢索組件、一個外部知識數據庫和一個生成組件。

在基本的RAG場景中,大致有如下步驟:首先將文本劃分為多個塊,使用Transformer Encoder模型將這些塊嵌入到向量中,將這些向量存儲到向量數據庫并建立索引,查詢會檢索向量數據庫中相關的上下文,這些上下文和查詢一起生成最終的LLM提示,并引導LLM合成響應。

RAG系統包含三個關鍵模塊:

Retriever:從上下文相關的知識源中檢索文本段落;

Reranker(可選):對檢索到的段落重新打分和重新排序;

Generator:將上下文與檢索到的段落集成以生成輸出文本

二、使用LangChain和Huggingface實現基本RAG

三、高級RAG

? ? ? ?最基本、最簡單的RAG系統有時候會檢索不到相關的上下文,因此需要一些更高級的方法來增強RAG系統,比如:查詢轉換、重排序等。

3.1 高級RAG(檢索增強生成)技術涵蓋以下內容:

???基本RAG:它涉及從外部知識數據庫中檢索文檔,并將這些文檔與用戶的查詢一起傳遞給LLM以生成響應。主要組件是檢索組件、外部知識數據庫和生成組件。

???RAG的成功要求:一個成功的RAG系統應該有兩個主要功能:檢索必須找到與用戶查詢最相關的文檔,生成必須有效地利用這些文檔來回答用戶查詢。

???高級RAG:構建高級RAG需要應用更復雜的技術和策略來滿足成功要求。這些技術既可以獨立地滿足其中一個高級成功需求,也可以同時滿足這兩個需求。

?? 高級檢索技術:這包括通過網格搜索執行超參數調整,以及為遞歸或路由檢索構建外部知識。

??? 高級生成技術:這包括充分利用檢索到的文檔,對結果進行重新排序,以及使用信息壓縮來減少噪聲。

???同時定位檢索和生成的高級技術:這包括生成器增強檢索和迭代檢索生成器RAG。

3.2 高級RAG常用的技術

a)基本索引

b)分層索引

c)語句窗口檢索

d)父文檔檢索器

e)融合檢索

f)查詢轉換

g)聊天引擎檢索

h)多文檔檢索

3.3 高級RAG技術總結:

? ? ???RAG通過集成外部知識檢索來增強語言模型,從而提高生成的準確性、相關性和信息覆蓋率。

      檢索器的進步提升了長文檔和關鍵字查詢的詞匯、語義和上下文相關性匹配度。

       重排序體系結構專門用于精確預測相關性,采用結合預訓練、模型大小和網絡體系結構的策略。

       生成器通過截斷提取、加權記憶無縫地整合外部證據。

? ? ??混合RAG系統將兩種LLM結合在一起,以最大限度地提高質量和高效SLM的可擴展性和吞吐量。

參考文獻:

[1]?https://regupathit.medium.com/advanced-rag-cooking-guide-techniques-3e505b4fb76f

本文章轉載微信公眾號@ArronAI

上一篇:

LLM之RAG理論(五)| 使用知識圖譜增強RAG

下一篇:

LLM之RAG理論(七)| 高提升RAG檢索的四種方法
#你可能也喜歡這些API文章!

我們有何不同?

API服務商零注冊

多API并行試用

數據驅動選型,提升決策效率

查看全部API→
??

熱門場景實測,選對API

#AI文本生成大模型API

對比大模型API的內容創意新穎性、情感共鳴力、商業轉化潛力

25個渠道
一鍵對比試用API 限時免費

#AI深度推理大模型API

對比大模型API的邏輯推理準確性、分析深度、可視化建議合理性

10個渠道
一鍵對比試用API 限時免費