
如何快速實現REST API集成以優化業務流程
論文地址:https://arxiv.org/pdf/2311.09210.pdf
檢索增強語言模型(RALM)已成為自然語言處理中一種強大的新范式。通過將大型預訓練語言模型與外部知識檢索相結合,RALM可以減少事實錯誤和幻覺,同時注入最新知識。然而,目前的RALM面臨以下幾個關鍵挑戰:
? ? ? ?為了解決這些問題,騰訊人工智能實驗室的研究人員在他們的論文《CHAIN-OF-NOTE: ENHANCING ROBUSTNESS IN RETRIEVAL-AUGMENTED LANGUAGE MODELS》中提出了一個新的框架,稱為筆記鏈(CON)。
筆記鏈的關鍵思想是通過對檢索到的每個文檔進行總結和評估,讓模型生成閱讀筆記,然后再生成最終的回應。此記錄過程可以增強模型的以下能力:
具體而言,給定一個問題和k個檢索到的文檔,“筆記鏈”會進行如下操作:
這種方法反映了人類的推理——將問題分解為更小的步驟。筆記為模型的思維過程提供了透明度,并提高了其噪聲和未知穩健性。
筆記鏈生成的筆記可分為三類:
? ? ? ?該系統允許模型在直接檢索信息、進行推斷和承認其局限性之間取得平衡。
筆記鏈(CON)框架根據檢索到的文檔與輸入問題的相關性生成三種類型的閱讀筆記。以下是每種類型的筆記的示例:
輸入問題:“法國首都是什么?”
檢索文件:一篇討論法國各個城市的文章。
生成的筆記:“正如文章中所提到的,法國的首都是巴黎?!?/p>
最后回應:“法國首都是巴黎。”
輸入問題:“光合作用是如何工作的?”
檢索文件:解釋植物生物學基礎的文本,不直接涉及光合作用。
生成筆記:“雖然該文件沒有直接解釋光合作用,但它提供了有關植物生物學的有用信息,表明光合作用是植物將光轉化為能量的過程?!?/p>
最后回應:“光合作用是植物將光轉化為能量的過程,包括葉綠素對光的吸收以及二氧化碳和水轉化為葡萄糖和氧氣?!?/p>
輸入問題:“量子計算的最新進展是什么?”
檢索文檔:一篇討論經典計算技術的文章。
生成的筆記:“檢索到的文檔不包括量子計算,而是專注于經典計算技術。該模型缺乏足夠的信息來根據此文檔進行回答?!?/p>
最終回應:“未知,因為現有文件沒有提供量子計算最新進展的相關信息?!?/p>
這些例子說明了CON框架如何處理不同類型的文檔:直接使用相關文檔中的信息,從上下文有用的文檔中推斷答案,并承認知識或無關信息中的差距。
為了訓練一個模型來生成閱讀筆記,騰訊團隊執行如下步驟:
在幾個QA數據集的實驗表明:
讓我們通過一個示例來了解筆記鏈的作用:
問題:《死侍2》是什么時候上映的?
文檔1:討論2018年6月1日在美國上映的《死侍2》。
文檔2:提及《死侍2》于2018年5月10日首播,日期變更后于2018年8月18日上映。
標準RALM:2018年6月1日?
帶筆記鏈的RALM:
文檔1筆記:猜測《死侍2》于2018年6月1日在美國上映。
文檔2筆記:明確實際發布日期為2018年5月18日。
回復:根據Doc 2,答案為2018年5月18日?
這展示了筆記鏈如何仔細分析文件,并確定最相關、最可信的細節,以產生正確的回應。
參考文獻:
[1] https://ai.plainenglish.io/unlocking-the-black-box-how-chain-of-note-brings-transparency-to-retrieval-augmented-models-rag-ae1ebb007876
[2]?https://arxiv.org/pdf/2311.09210.pdf、
本文章轉載微信公眾號@ArronAI