
使用NestJS和Prisma構建REST API:身份驗證
const systemPrompt = 您正在檢查一個顧客和Example bank聊天機器人之間的對話。查看Example bank的政策、產品或服務的文檔對于聊天機器人回應顧客是必要的。請構建一個搜索查詢,該查詢將被用于檢索相關文檔,以便回應用戶。
let optimizedSearchQuery = await this.textCompletionEngine.complete(
[
{ role: ‘system’, content: systemPrompt },
{ role: ‘user’, content: stringifyChatConversation(messages) }
],
‘gpt-4’,
{
temperature: 0,
maxTokens: 100,
},
);
這種技術的一個變體是查詢擴展,LLM生成多個子搜索查詢。這種變體在具有混合檢索系統的RAG系統中特別有用,該系統將來自具有不同結構的多個數據存儲庫的搜索結果結合在一起(例如,SQL數據庫+單獨的向量數據庫)。其他提示工程技術,如后退提示和HyDE(在下一節中討論),也可以與這種方法結合使用。
在信息檢索中,查詢-文檔不對稱指的是用戶提出的查詢與文檔庫中實際文檔之間的語義差異。為了解決這一問題并提高檢索結果的語義相似性,可以應用一種稱為假設性文檔嵌入(HyDE)的技術。以下是對這項技術的詳細介紹:
通過使用HyDE技術,可以改善信息檢索系統的性能,提高檢索結果的質量,使得系統更加智能和適應用戶需求。
在這個技術介紹中,提到了兩個關鍵概念:查詢路由和RAG決策器模式,這些是用于增強檢索系統性能和效率的先進技術。
1. RAG決策器模式:
2. 應用場景:
3. 優勢與挑戰:
通過實現查詢路由和采用RAG決策器模式,可以使檢索系統更加智能和高效,提升用戶體驗,并為系統的運行和維護帶來更多便利。
以上就是檢索中可用的3種高級RAG技巧。
預檢索即檢索前的5種RAG高級技巧,可以閱讀歷史文章:從預檢索到生成的15種高級RAG技術(篇一)
明天我們將繼續分享:檢索后的3種RAG高級技巧。
敬請期待…
AI智能時代,我們更需要成為一個獨立思考、獨一無二的個體。持續學習,遇見不一樣的自己。
文章轉自微信公眾號@耳東觀察