日本中文字幕不卡在线一区二区 ,色狠狠一区二区三区香蕉蜜桃,91精品国产综合久久青草

1.2 Graph RAG

? ? ? 在檢索增強生成（RAG）的上下文中，Graph RAG 引入了一項重大增強功能：使用大型語言模型（LLM（最好是 GPT-4）將源文檔塊轉(zhuǎn)換為實體和關系。這個預處理步驟至關重要，因為實體及其之間關系的準確提取對于后續(xù)的知識圖譜構(gòu)建至關重要，這因領域而異。

?當我們仔細觀察架構(gòu)時，我們可以看到，首先將文檔拆分為可管理的塊，并將這些塊轉(zhuǎn)換為實體和關系，這些實體和關系構(gòu)成了知識圖譜的基礎。利用 LLM，我們?yōu)槊總€節(jié)點確定最接近的社區(qū)，從而創(chuàng)建分層結(jié)構(gòu)。此層次結(jié)構(gòu)允許模型生成社區(qū)級別的摘要，然后將其存儲在向量數(shù)據(jù)庫中。

? ? ? 當用戶提交查詢時，將對其進行處理以標識最相關的社區(qū)級別。系統(tǒng)從排名最高的社區(qū)檢索摘要，并使用 LLM。

二、RAG 和 Graph RAG 的成本

? ? ? ?RAG（檢索增強生成）和 Graph RAG 都有自己的優(yōu)點和缺點。從我審查過的幾個測試用例來看，每種方法產(chǎn)生的響應都存在顯著差異。

? ? ? 與傳統(tǒng) RAG 相比，Graph RAG 的主要優(yōu)勢在于它能夠檢索有關查詢中提到的實體的全面詳細信息。Graph RAG 不僅獲取有關查詢實體的詳細信息，還標識并將其與其他連接的實體相關聯(lián)。相比之下，標準 RAG 檢索的信息僅限于特定文檔塊，更廣泛的關系和聯(lián)系捕獲不足。

? ? ? ?Graph RAG 的增強功能也有其自身的挑戰(zhàn)。在我的實驗中，我提取了一個包含大約 83,000 個令牌的文件，這些令牌需要分塊和嵌入。使用標準的 RAG 方法，使用大致相同數(shù)量的令牌創(chuàng)建嵌入。當我使用 Graph RAG 攝取同一個文件時，該過程涉及大量的提示和處理，產(chǎn)生了大約 1,000,000 個令牌——幾乎是單個文件原始令牌計數(shù)的 12 倍。

本文章轉(zhuǎn)載微信公眾號@ArronAI