国产一区二区fc2ppv在线播放,成人午夜视频在线播放,精品欧美一区视频在线观看

（圖：廣義的RAG問答鏈路）除了傳統意義上的增強內容生成，RAG的理念還可以進一步泛化到鏈路的其他階段：

增強訓練：REALM[7]引入了知識檢索器增強大模型預訓練，以改進大模型的問答質量和可解釋性。
增強微調：RA-DIT[10]實現了對大模型和檢索器的雙指令微調，RAFT[11]通過微調讓大模型可以識別干擾文檔。
增強語料：MuRAG[12]支持了多模態數據的檢索，提升了大模型在文本/圖像混合檢索場景下的推理質量。
增強知識：GraphRAG[22]使用圖社區摘要解決總結性查詢任務的問題，將知識圖譜技術應用到RAG。
增強檢索：CRAG[13]通過對檢索到的文檔置信度進行評估，提升問答上下文的質量。
增強推理：RAT[8]在推理階段將RAG與CoT相結合，以改進長期推理和生成任務的效果。

我們希望向大家分享一下：引入知識圖譜技術后，傳統RAG鏈路到Graph RAG鏈路會有什么樣的變化，如何兼容RAG中的向量數據庫（Vector Database）和圖數據庫（Graph Database）基座，以及螞蟻的Graph RAG開源技術方案和未來優化方向。

二、傳統RAG

首先回顧一下傳統RAG的核心鏈路。

（圖：基于Vector的RAG鏈路）傳統RAG的核心鏈路分為三個階段：

索引（向量嵌入）：通過Embedding模型服務實現文檔的向量編碼，寫入向量數據庫。
檢索（相似查詢）：通過Embedding模型服務實現查詢的向量編碼，使用相似性查詢（ANN）實現topK結果搜索。
生成（文檔上下文）：Retriver檢索的結果文檔作為上下文和問題一起提交給大模型處理。

傳統RAG希望通過知識庫的關聯知識增強大模型問答的上下文以提升生成內容質量，但也存在諸多問題。

（圖：傳統RAG的不足）論文[23]總結了傳統RAG的7個問題：

知識庫內容缺失：現有的文檔其實回答不了用戶的問題，系統有時被誤導，給出的回應其實是“胡說八道”，理想情況系統應該回應類似“抱歉，我不知道”。
TopK截斷有用文檔：和用戶查詢相關的文檔因為相似度不足被TopK截斷，本質上是相似度不能精確度量文檔相關性。
上下文整合丟失：從數據庫中檢索到包含答案的文檔，因為重排序/過濾規則等策略，導致有用的文檔沒有被整合到上下文中。
有用信息未識別：受到LLM能力限制，有價值的文檔內容沒有被正確識別，這通常發生在上下文中存在過多的噪音或矛盾信息時。
提示詞格式問題：提示詞給定的指令格式出現問題，導致大模型/微調模型不能識別用戶的真正意圖。
準確性不足：LLM沒能充分利用或者過度利用了上下文的信息，比如給學生找老師首要考慮的是教育資源的信息，而不是具體確定是哪個老師。另外，當用戶的提問過于籠統時，也會出現準確性不足的問題。
答案不完整：僅基于上下文提供的內容生成答案，會導致回答的內容不夠完整。比如問“文檔 A、B和C的主流觀點是什么？”，更好的方法是分別提問并總結。

總的來看：

問題1-3：屬于知識庫工程層面的問題，可以通過完善知識庫、增強知識確定性、優化上下文整合策略解決。
問題4-6：屬于大模型自身能力的問題，依賴大模型的訓練和迭代。
問題7：屬于RAG架構問題，更有前景的思路是使用Agent引入規劃能力。

考慮到傳統RAG能力上的不足，Graph RAG從增強知識確定性角度做了進一步的改進，也就是最開始提到的知識內容增強的思路。相比于傳統的基于Vector格式的知識庫存儲，Graph RAG引入了知識圖譜技術，使用Graph格式存儲知識。正如論文[2]所闡述的：基于知識圖譜，可以為RAG提供高質量的上下文，以減輕模型幻覺。

Structured data, such as knowledge graphs (KGs), provide high-quality context and mitigate model hallucinations.

（圖：基于Graph的RAG鏈路）類似地，Graph RAG的核心鏈路分如下三個階段：

索引（三元組抽?。和ㄟ^LLM服務實現文檔的三元組提取，寫入圖數據庫。
檢索（子圖召回）：通過LLM服務實現查詢的關鍵詞提取和泛化（大小寫、別稱、同義詞等），并基于關鍵詞實現子圖遍歷（DFS/BFS），搜索N跳以內的局部子圖。
生成（子圖上下文）：將局部子圖數據格式化為文本，作為上下文和問題一起提交給大模型處理。

需要說明的是，從文本中提取三元組和關鍵詞借助了現有的文本大模型的能力，傳統的NLP技術如分詞、句法分析、實體識別等已經不再是SOTA。另外，借助于大模型微調技術，可以針對性的構建面向知識抽取、實體識別、自然語言翻譯的專有大模型。比如由螞蟻和浙大聯合研發的大模型知識抽取框架OneKE[38]在零樣本泛化性能上全面超過了現有模型。以及借助于Text2GQL、Text2Cypher技術微調的圖查詢語言專有模型，可以直接將自然語言轉換為圖查詢語言，代替基于關鍵詞中心的子圖搜索從而獲得更精確的圖譜數據。

（圖：OneKE知識抽取模型能力透視）

四、通用RAG設計?

基于以上對傳統RAG和Graph RAG的能力介紹，我們可以發現兩種RAG架構的核心差異在于知識存儲格式的變化（從Vector到Graph），從而導致了RAG中索引、檢索和生成階段流轉數據格式的變化。而RAG的關鍵流程并未發生根本的改變，基于這個相似性前提，我完全可以抽象出一個更通用的RAG結構，以兼容向量索引和圖索引，甚至更多的索引格式（如全文索引等）。

4.1 架構設計

于是一個兼容多種知識索引格式的通用RAG架構，可以按照如下方式設計。

所有的索引存儲統一抽象為IndexStore，LLM服務作為構建索引能力依賴（文本模型、嵌入模型等）。
索引存儲當下支持向量存儲（VectorStore）和知識圖譜（Knowledge Graph）兩種，保留對其他索引格式的擴展能力。
知識圖譜層負責知識的表示和語義抽象，數據底座是圖存儲（GraphStore）。當然也可以直接對接外部的知識圖譜系統。
最底層接入多樣化的向量數據庫、圖數據庫、大模型服務等外部組件。
最上層借助于IndexStore核心抽象，搭配外圍的Loader/Splitter實現文本讀取切分、Transformer實現索引的構建、Retriver/Synthesizer實現知識檢索與合成，構建完整的RAG能力。

（圖：通用RAG架構）

4.2 領域建模

建模是架構落地的第一步，這里對通用RAG的核心設計做出說明：

為了讓框架有足夠的靈活性，我們將索引的加工和存儲進行了分離，并使用“橋接模式”構建抽象依賴關系。
索引的加工接口（Transformer）提供三類特定實現：嵌入、抽取、翻譯。向量索引走嵌入的方式，如Text2Vector、OpenAI Embedding等。圖索引走Extractor，如三元組抽取、關鍵詞抽取等。翻譯可以作為通用能力單獨對待，承載DSL的模型微調能力，如Text2SQL、Text2GQL、Text2Cypher等。索引加工的輸入是Splliter切分好的文本塊（未來也可以是多模態數據），輸出是索引存儲系統，是連接內容和存儲的橋梁。
索引的存儲接口（IndexStore）提供了向量存儲和知識圖譜兩類實現，知識圖譜接口依賴于圖存儲接口，也可以單獨實現。從這里也能看出圖存儲系統的定位是數據基座而非搜索語義，它和向量存儲不在同一個架構層次。
大模型服務的接口設計未在圖中展開，我們可以將其看做索引加工過程依賴的內部能力。

（圖：通用RAG建模）

4.3 技術選型

綜上所述，要構建一個完整的開源Graph RAG鏈路，離不開三個重要的子系統：一個可以支持RAG的AI工程框架，一個知識圖譜系統和一個圖存儲系統。開源的AI工程框架有諸多選型：LangChain、LlamaIndex、RAGFlow、DB-GPT等。知識圖譜系統有：Jena、RDF4J、Oxigraph、OpenSPG等。圖存儲系統有Neo4j、JanusGraph、NebulaGraph、TuGraph等。而作為螞蟻首個對外開源的Graph RAG框架，我們采用螞蟻全自主的開源產品：DB-GPT[50]?+ OpenSPG[42]?+ TuGraph[46]。

（圖：螞蟻Graph RAG開源方案）

4.3.1 AI工程框架（@DB-GPT）

DB-GPT是一個開源的AI原生數據應用開發框架，目的是構建大模型領域的基礎設施，通過開發多模型管理(SMMF)、Text2SQL效果優化、RAG框架以及優化、Multi-Agents框架協作、AWEL(智能體工作流編排)等多種技術能力，讓圍繞數據庫構建大模型應用更簡單，更方便。

（圖：DB-GPT技術架構）

4.3.2 知識圖譜（@OpenSPG）

OpenSPG是螞蟻集團結合多年金融領域多元場景知識圖譜構建與應用業務經驗的總結，并與OpenKG聯合推出的基于SPG(Semantic-enhanced Programmable Graph)框架研發的知識圖譜引擎。

（圖：OpenSPG技術架構）

4.3.3 圖數據庫（@TuGraph）

TuGraph是螞蟻集團與清華大學聯合研發的大規模圖處理系統，構建了包含圖數據庫、圖計算引擎、圖機器學習、圖研發平臺的完善圖技術體系。支持海量多源的關聯數據的實時處理，顯著提升數據分析效率，支撐了螞蟻支付、安全、社交、公益、數據治理等300多個場景應用，多次打破圖數據庫性能基準測試LDBC-SNB世界紀錄，并躋身IDC中國圖數據庫市場領導者象限。

（圖：TuGraph技術架構）

五、開源技術方案??

在DB-GPT的v0.5.6[47]版本中，我們提供了完整的Graph RAG框架實現（PR 1506[48]）。接下來我們結合這個PR，闡述Graph RAG的關鍵實現細節。

5.1 索引

索引加工的統一抽象是TransformerBase接口，目前提供了嵌入、抽取、翻譯三類轉換器。而圖索引的構建，則通過三元組提取器TripletExtractor來實現。

（圖：TransformerBase接口的繼承樹）ExtractorBase接口負責信息提取的職責，當下已有的三元組提取器和關鍵詞提取器都依賴了大模型能力，所以抽象類LLExtractor負責與LLM交互的公共邏輯，具體的實現類只需要提供提示詞模板和結果解析即可。三元組提取器TripletExtractor的提示詞模板（受LlamaIndex啟發），核心理念是通過few-shot樣本引導大模型生成三元組結構。

TRIPLET_EXTRACT_PT = (

    "Some text is provided below. Given the text, "

    "extract up to knowledge triplets as more as possible "

    "in the form of (subject, predicate, object).\n"

    "Avoid stopwords.\n"

    "---------------------\n"

    "Example:\n"

    "Text: Alice is Bob's mother.\n"

    "Triplets:\n(Alice, is mother of, Bob)\n"

    ...TL;DR...

    "Text: Philz is a coffee shop founded in Berkeley in 1982.\n"

    "Triplets:(Philz, is, coffee shop)\n(Philz, founded in, Berkeley)\n(Philz, founded in, 1982)\n"

    "---------------------\n"

    "Text: {text}\n"

    "Triplets:\n"

)

大模型讓三元組抽取變成了一件非常簡單的事情，但是要提高三元組的抽取質量也不是一件容易的事情。最簡單的是通過提示詞工程不斷優化提示詞模板，讓通用大模型給出更理想的答案。另外使用專有的知識抽取大模型（如OneKE）可以取得更好的效果，這部分工作還在進行中，我們期望看到OnekeExtractor的社區貢獻早日發布。

5.2 存儲

索引存儲的統一抽象是IndexStoreBase接口，目前提供了向量、圖、全文三類索引實現。知識圖譜接口KnowledgeGraphBase是Graph RAG的存儲底座，目前DB-GPT內置的BuiltinKnowledgeGraph實現就是基于文本大模型能力構建的，OpenSPG的接入工作已經在逐步推進。

（圖：IndexStoreBase接口的繼承樹）知識圖譜提供了和向量數據庫同樣的接口，讓知識的存取過程透明化。文檔內容經過三元組解析器_triplet_extractor解析后，直接寫入圖存儲_graph_store。

sync def aload_document(self, chunks: List[Chunk]) -> List[str]:

    """Extract and persist triplets to graph store.

    Args:

        chunks: List[Chunk]: document chunks.

    Return:

        List[str]: chunk ids.

    """

    for chunk in chunks:

        triplets = await self._triplet_extractor.extract(chunk.content)

        for triplet in triplets:

            self._graph_store.insert_triplet(*triplet)

        logger.info(f"load {len(triplets)} triplets from chunk {chunk.chunk_id}")

    return [chunk.chunk_id for chunk in chunks]

圖存儲接口GraphStoreBase提供統一的圖存儲抽象，目前內置了MemoryGraphStore和TuGraphStore的實現，分別用于本地測試和生產部署，并預留了Neo4jStore的擴展點。

（圖：GraphStoreBase接口的繼承樹）具體的圖存儲提供了三元組寫入的實現，一般會調用圖數據庫的查詢語言來完成。例如TuGraphStore會根據三元組生成具體的Cypher語句并執行。

def insert_triplet(self, subj: str, rel: str, obj: str) -> None:

    """Add triplet."""

    ...TL;DR...

    subj_query = f"MERGE (n1:{self._node_label} {{id:'{subj}'}})"

    obj_query = f"MERGE (n1:{self._node_label} {{id:'{obj}'}})"

    rel_query = (

        f"MERGE (n1:{self._node_label} {{id:'{subj}'}})"

        f"-[r:{self._edge_label} {{id:'{rel}'}}]->"

        f"(n2:{self._node_label} {{id:'{obj}'}})"

    )

    self.conn.run(query=subj_query)

    self.conn.run(query=obj_query)

    self.conn.run(query=rel_query)

5.3 檢索

接口ExtractorBase的另一個實現則是關鍵詞抽取器KeywordExtractor，負責提取用戶問題中涉及的實體關鍵詞，它也是借助大模型的能力實現的，同樣繼承于LLExtractor，提示詞模板如下。

KEYWORD_EXTRACT_PT = (

    "A question is provided below. Given the question, extract up to "

    "keywords from the text. Focus on extracting the keywords that we can use "

    "to best lookup answers to the question.\n"

    "Generate as more as possible synonyms or alias of the keywords "

    "considering possible cases of capitalization, pluralization, "

    "common expressions, etc.\n"

    "Avoid stopwords.\n"

    "Provide the keywords and synonyms in comma-separated format."

    "Formatted keywords and synonyms text should be separated by a semicolon.\n"

    "---------------------\n"

    "Example:\n"

    "Text: Alice is Bob's mother.\n"

    "Keywords:\nAlice,mother,Bob;mummy\n"

    "Text: Philz is a coffee shop founded in Berkeley in 1982.\n"

    "Keywords:\nPhilz,coffee shop,Berkeley,1982;coffee bar,coffee house\n"

    "---------------------\n"

    "Text: {text}\n"

    "Keywords:\n"

)

關鍵詞的抽取涉及到文本中實體識別技術，在構造提示詞時需要考慮單詞的大小寫、別稱、同義詞等情況，這部分還有很大的優化空間。另外，借助于模型微調直接翻譯自然語言到圖查詢語句也是值得探索的方向。圖存儲接口GraphStoreBase提供了基于關鍵詞的探索接口?explore，會根據抽取的關鍵詞召回局部子圖。

@abstractmethod

def explore(

    self,

    subs: List[str],

    direct: Direction = Direction.BOTH,

    depth: Optional[int] = None,

    fan: Optional[int] = None,

    limit: Optional[int] = None,

) -> Graph:

    """Explore on graph."""

這里對接口含義做補充說明：

subs：子圖搜索的起點列表。
direct：搜索方向，默認雙向搜索，即同時探索引用和被引用關系。
depth：搜索深度，控制圖搜索的最大跳數，默認不做限制。
fan：扇出限制，控制每一跳的最大鄰居數，避免數據熱點問題，默認不做限制。
limit：結果邊數限制，默認不做限制。

返回值：Graph接口類型，表示搜索結果子圖，提供了便捷的點邊更新API。TuGraph的explore接口實現核心邏輯是將上述參數轉化為Cypher查詢語句，形如：

query = (

    f"MATCH p=(n:{self._node_label})"

    f"-[r:{self._edge_label}*1..{depth}]-(m:{self._node_label}) "

    f"WHERE n.id IN {subs} RETURN p LIMIT {limit}"

)

5.4 生成

和其他向量數據庫類似，BuiltinKnowledgeGraph同樣實現了IndexStoreBase的相似性查詢接口。

async def asimilar_search_with_scores(

    self,

    text,

    topk,

    score_threshold: float,

    filters: Optional[MetadataFilters] = None,

) -> List[Chunk]:

    """Search neighbours on knowledge graph."""

    if not filters:

        logger.info("Filters on knowledge graph not supported yet")



    # extract keywords and explore graph store

    keywords = await self._keyword_extractor.extract(text)

    subgraph = self._graph_store.explore(keywords, limit=topk)

    logger.info(f"Search subgraph from {len(keywords)} keywords")



    content = (

        "The following vertices and edges data after [Subgraph Data] "

        "are retrieved from the knowledge graph based on the keywords:\n"

        f"Keywords:\n{','.join(keywords)}\n"

        "---------------------\n"

        "You can refer to the sample vertices and edges to understand "

        "the real knowledge graph data provided by [Subgraph Data].\n"

        "Sample vertices:\n"

        "(alice)\n"

        "Sample edges:\n"

        "(alice)-[reward]->(alice)\n"

        "---------------------\n"

        f"Subgraph Data:\n{subgraph.format()}\n"

    )

    return [Chunk(content=content, metadata=subgraph.schema())]

關鍵詞通過關鍵詞抽取器_keyword_extractor完成，抽取到的關鍵詞傳遞給圖存儲對象_graph_store進行子圖探索，探索結果子圖直接格式化到提示詞上下文字符串content內。
細心的讀者可以發現，子圖探索的結果直接封裝為Graph接口類型，我們甚至還提供了一個MemoryGraph工具類實現。這樣實現圖探索接口時，就無需將查詢結果轉化為Path/Table等內存不友好的格式了，同時也降低了提示詞中編碼子圖數據的token開銷。當然這是建立大模型對Graph數據結構原生的理解基礎上，我們相信這是當下主流大模型的基本能力。

（圖：Graph接口的核心API）

5.5 測試

我們使用《變形金剛》的故事材料tranformers_story.md[49]作為測試文本，驗證DB-GPT上Graph RAG的效果。具體操作手冊見DB-GPT的文檔《Graph RAG User Manual》[31]。
啟動DB-GPT后，新增Knowledge Space，選擇Knowledge Graph存儲類型。上傳tranformers_story.md后切片自動構建圖索引。

（圖：創建知識圖譜）構建好的知識圖譜支持快速預覽。

（圖：知識圖譜預覽）基于知識圖譜的對話測試。

（圖：知識圖譜對話）

六、優化方向??

其實大家在對DB-GPT上Graph RAG實現進行初步的測試后，會發現當下仍有不少體驗問題。不避諱的講，這里除了功能完善度的原因之外，還有Graph RAG自身設計上的不足，這也為后續的進一步優化方向提供了思路。文章[26]總結了Graph RAG的不足：

GraphRAG, like RAG, has clear limitations, which include how to form graphs, generate queries for querying these graphs, and ultimately decide how much information to retrieve based on these queries. The main challenges are ‘query generation’, ‘reasoning boundary’, and ‘information extraction’.

總的來看分為三大類：

信息抽?。?/strong>如何構建高質量的知識圖譜？

查詢生成：如何在生成知識圖譜上的查詢？

推理邊界：如何限制查詢結果的規模？

像前邊提到的，知識抽取/關鍵詞/查詢語言的微調模型主要專注于信息抽取和查詢生成。另外，論文[24]實現的基于圖的推理增強框架（RoG）則是在推理邊界方向嘗試的創新（思路有點類似RAT）：

（圖：RoG：基于圖的推理增強）當然上述三個階段也可以被簡化合并為兩個階段：內容索引階段和檢索生成階段。我們就這兩個大的階段分別討論Graph RAG后續可能的優化方向和思路。

6.1 內容索引階段

Graph RAG的內容索引階段主要目標便是構建高質量的知識圖譜，值得繼續探索的有以下方向：

圖譜元數據：從文本到知識圖譜，是從非結構化信息到結構化信息的轉換的過程，雖然圖一直被當做半結構化數據，但有結構的LPG（Labeled Property Graph）除了有利于圖存儲系統的性能優化，還可以協助大模型更好地理解知識圖譜的語義，幫助其生成更準確的查詢。

知識抽取微調：通用大模型在三元組的識別上實際測試下來仍達不到理想預期，針對知識抽取的微調模型反而表現出更好地效果，如前面提到的OneKE。

圖社區總結：這部分源自于微軟的Graph RAG的研究工作，通過構建知識圖譜時生成圖社區摘要，以解決知識圖譜在面向總結性查詢時“束手無策”的問題。另外，同時結合圖社區總結與子圖明細可以生成更高質量的上下文。

多模態知識圖譜：多模態知識圖譜可以大幅擴展Graph RAG知識庫的內容豐富度，對客觀世界的數據更加友好，浙大的MyGO[37]框架提出的方法提升MMKGC（Multi-modal Knowledge Graph Completion）的準確性和可靠性。Graph RAG可以借助于MMKG（Multi-modal Knowledge Graph）和MLLM（Multi-modal Large Language Model）實現更全面的多模態RAG能力。

混合存儲：同時使用向量/圖等多種存儲系統，結合傳統RAG和Graph各自的優點，組成混合RAG。參考文章[27]提出的多種Graph RAG架構，如圖學習語義聚類、圖譜向量雙上下文增強、向量增強圖譜搜索、混合檢索、圖譜增強向量搜索等，可以充分利用不同存儲的優勢提升檢索質量。

（圖：混合檢索的Graph RAG）

6.2 檢索生成階段

Graph RAG的檢索生成階段主要目標便是從知識圖譜上召回高質量上下文，值得繼續探索的有以下方向：

圖語言微調：使用自然語言在知識圖譜上做召回，除了基本的關鍵詞搜索方式，還可以嘗試使用圖查詢語言微調模型，直接將自然語言翻譯為圖查詢語句，這里需要結合圖譜的元數據以獲得更準確的翻譯結果。過去，我們在Text2GQL上做了一些初步的工作。

混合RAG：這部分與前邊講過的混合存儲是一體的，借助于底層的向量/圖/全文索引，結合關鍵詞/自然語言/圖語言多種檢索形式，針對不同的業務場景，探索高質量Graph RAG上下文的構建。

測試驗證：Graph RAG的測試和驗證可以參考傳統RAG的Benchmark方案，如RAGAS[32]、ARES[35]、RECALL[36]、RGB[33]、CRUD-RAG[34]等。

RAG智能體：從某種意義上說，RAG其實是Agent的簡化形式（知識庫可以看到Agent的檢索工具），同時當下我們也看到RAG對記憶和規劃能力的集成訴求（如RAT/RoG等），因此未來RAG向帶有記憶和規劃能力的智能體架構演進幾乎是必然趨勢。另外，Agent自身需要的長期記憶存儲也會反向依賴RAG的知識庫，所以RAG與Agent其實是相輔相成、互相促進的。

七、尾記??

通過以上介紹，相信大家對RAG到Graph RAG的技術演進有了更進一步的了解，并且基于RAG的索引、檢索、生成三個基本階段抽象出了通用的RAG框架，兼容了Vector、Graph、FullText等多種索引形式，最終在開源技術中完整落地。最后通過探討Graph RAG未來的優化與演進方向，總結了內容索引和檢索生成階段的不同改進思路，以及RAG向Agent架構的演化趨勢。Graph RAG是個相對新穎AI工程領域，需要探索和改進的工作還有很多要做，我們誠邀DB-GPT/OpenSPG/TuGraph的廣大開發者們一起參與共建。

前不久Jerry Liu（LlamaIndex CEO）在技術報告《Beyond RAG: Building Advanced Context-Augmented LLM Applications》中也拋出了“RAG的未來是Agent”相似觀點。所以，無論是“RAG for Agents”還是“Agents for RAG”，亦或是“從RAG到Graph RAG再到Agents”，目光可及的是智能體將是未來AI應用的主旋律。

參考資料：

RALM_Survey：https://github.com/2471023025/RALM_Survey

Retrieval-Augmented Generation for Large Language Models: A Survey：https://arxiv.org/abs/2312.10997

A Survey on Retrieval-Augmented Text Generation for Large Language Models：https://arxiv.org/abs/2404.10981

Retrieving Multimodal Information for Augmented Generation: A Survey：https://arxiv.org/abs/2303.10868

Evaluation of Retrieval-Augmented Generation: A Survey：https://arxiv.org/abs/2405.07437

GFMPapers：https://github.com/BUPT-GAMMA/GFMPapers

REALM: Retrieval-Augmented Language Model Pre-Training：https://arxiv.org/abs/2002.08909

RAT: Retrieval Augmented Thoughts Elicit Context-Aware Reasoning in Long-Horizon Generation：https://arxiv.org/abs/2403.05313

RAG and RAU: A Survey on Retrieval-Augmented Language Model in Natural Language Processing：https://arxiv.org/pdf/2404.19543

RA-DIT: Retrieval-Augmented Dual Instruction Tuning：https://arxiv.org/abs/2310.01352

RAFT: Adapting Language Model to Domain Specific RAG：https://arxiv.org/abs/2403.10131

MuRAG: Multimodal Retrieval-Augmented Generator for Open Question Answering over Images and Text：https://arxiv.org/abs/2210.02928

Corrective Retrieval Augmented Generation：https://arxiv.org/abs/2401.15884

Full Fine-Tuning, PEFT, Prompt Engineering, and RAG: Which One Is Right for You?：https://deci.ai/blog/fine-tuning-peft-prompt-engineering-and-rag-which-one-is-right-for-you/

An Easy Introduction to Multimodal Retrieval-Augmented Generation：https://developer.nvidia.com/blog/an-easy-introduction-to-multimodal-retrieval-augmented-generation/

Towards Long Context RAG：https://www.llamaindex.ai/blog/towards-long-context-rag

Full Fine-Tuning, PEFT, Prompt Engineering, and RAG: Which One Is Right for You?：https://deci.ai/blog/fine-tuning-peft-prompt-engineering-and-rag-which-one-is-right-for-you/

Advance RAG- Improve RAG performance：https://luv-bansal.medium.com/advance-rag-improve-rag-performance-208ffad5bb6a

Advanced Retrieval-Augmented Generation: From Theory to LlamaIndex Implementation：https://towardsdatascience.com/advanced-retrieval-augmented-generation-from-theory-to-llamaindex-implementation-4de1464a9930

RAGFlow：https://github.com/infiniflow/ragflow

LangChain RAG：https://python.langchain.com/v0.1/docs/use_cases/question_answering/

From Local to Global: A Graph RAG Approach to Query-Focused Summarization：https://arxiv.org/abs/2404.16130

Seven Failure Points When Engineering a Retrieval Augmented Generation System：https://arxiv.org/abs/2401.05856

Reasoning on Graphs: Faithful and Interpretable Large Language Model Reasoning：https://arxiv.org/abs/2310.01061

GraphRAG: Unlocking LLM discovery on narrative private data：https://www.microsoft.com/en-us/research/blog/graphrag-unlocking-llm-discovery-on-narrative-private-data/

From RAG to GraphRAG , What is the GraphRAG and why i use it?：https://medium.com/@jeongiitae/from-rag-to-graphrag-what-is-the-graphrag-and-why-i-use-it-f75a7852c10c

GraphRAG: Design Patterns, Challenges, Recommendations：https://gradientflow.com/graphrag-design-patterns-challenges-recommendations/

lettria：https://www.lettria.com/features/graphrag

Implementing GraphRAG for Query-Focused Summarization：https://dev.to/stephenc222/implementing-graphrag-for-query-focused-summarization-47ib

LlamaIndex Graph RAG：https://docs.llamaindex.ai/en/stable/examples/query_engine/knowledge_graph_rag_query_engine/

DB-GPT Graph RAG：https://docs.dbgpt.site/docs/latest/cookbook/rag/graph_rag_app_develop

RAGAS: Automated Evaluation of Retrieval Augmented Generation：https://arxiv.org/abs/2309.15217

Benchmarking Large Language Models in Retrieval-Augmented Generation：https://arxiv.org/abs/2309.01431

CRUD-RAG: A Comprehensive Chinese Benchmark for Retrieval-Augmented Generation of Large Language Models：https://arxiv.org/abs/2401.17043v2

ARES: An Automated Evaluation Framework for Retrieval-Augmented Generation Systems：https://arxiv.org/abs/2311.09476

RECALL: A Benchmark for LLMs Robustness against External Counterfactual Knowledge：https://arxiv.org/abs/2311.08147

MyGO: Discrete Modality Information as Fine-Grained Tokens for Multi-modal Knowledge Graph Completion：https://arxiv.org/abs/2404.09468

OneKE：https://github.com/zjunlp/DeepKE/blob/main/example/llm/OneKE.md

Apache Jena：https://github.com/apache/jena

Eclipse RDF4J：https://github.com/eclipse-rdf4j/rdf4j

Oxigraph：https://github.com/oxigraph/oxigraph

OpenSPG：https://github.com/OpenSPG/openspg

Neo4j：https://github.com/neo4j/neo4j

JanusGraph：https://github.com/JanusGraph/janusgraph

NebulaGraph：https://github.com/vesoft-inc/nebula

TuGraph：https://github.com/TuGraph-family/tugraph-db

DB-GPT v0.5.6: https://github.com/eosphoros-ai/DB-GPT/releases/tag/v0.5.6

Graph RAG PR: https://github.com/eosphoros-ai/DB-GPT/pull/1506

tranformers_story.md: https://github.com/eosphoros-ai/DB-GPT/blob/main/examples/test_files/tranformers_story.md

DB-GPT：https://github.com/eosphoros-ai/DB-GPT

文章轉自微信公眾號@阿里云開發者

上一篇：

AnalyticDB(ADB)+LLM：構建AIGC時代下企業專屬Chatbot

下一篇：

GraphRAG：基于PolarDB+通義千問api+LangChain的知識圖譜定制實踐

#你可能也喜歡這些API文章!

GraphRAG：基于PolarDB+通義千問api+LangChain的知識圖譜定制實踐

使用Node.js、Express和MySQL構建REST API

天氣API推薦：精準獲取氣象數據的首選

基于自定義數據集的微調：Alpaca與LLaMA模型的訓練

OAuth和OpenID Connect圖解指南

有哪些新聞媒體提供Open API？

現在做大模型，還有靠譜且免費的API接口嗎？

如何運用AI提高自己的工作效率？

區塊鏈API推薦，快速開發去中心化應用

我們有何不同？

API服務商零注冊

多API并行試用

數據驅動選型，提升決策效率
查看全部API→

??
熱門場景實測，選對API

#AI文本生成大模型API

對比大模型API的內容創意新穎性、情感共鳴力、商業轉化潛力

25個渠道
一鍵對比試用API 限時免費

#AI深度推理大模型API

對比大模型API的邏輯推理準確性、分析深度、可視化建議合理性

10個渠道
一鍵對比試用API 限時免費

內容目錄

一、概述
二、傳統RAG
四、通用RAG設計?
五、開源技術方案??
六、優化方向??
七、尾記??

返回頂部

冪簡集成是創新的API接口平臺，一站搜索、試用、集成國內外API接口。

API接口

API接口大全

免費API接口

抽象API接口

精選API接口

美國API接口

國外API接口

API接口

人工智能API

AI生成API

Web3 API

SEO API接口

數據API接口

在線工具API

API知識庫

API是什么

如何調用API

如何集成API

API貨幣化

如何開發API

API安全

冪簡集成

關于我們

加入我們

服務條款

隱私協議

網站地圖

Copyright ? 2024 All Rights Reserved 北京蜜堂有信科技有限公司

增值電信業務經營許可證：京B2-20191889

京ICP備18034931號

公司地址：北京市朝陽區光華路和喬大廈C座1508

意見反饋：010-533324933,mtyy@miitang.com

感谢您访问我们的网站，您可能还对以下资源感兴趣：
国内精品久久久久影院日本