"This is a positive sentence." Positive
"Negative sentiment in this text." Negative
"Neutral statement here." Neutral

問答類任務(wù)

數(shù)據(jù)通常包括問題和相應(yīng)的答案,當(dāng)需要結(jié)合上下文信息理解問題語境時(shí),通常還需要加上上下文信息,樣本格式示例:

Context                                   Question                            Answer
"The Eiffel Tower is located in Paris." "Where is the Eiffel Tower?" "Paris"
"There are nine planets in our solar system, including Earth."
"How many planets are there?" "Nine"
"William Shakespeare, a famous playwright, wrote 'Romeo and Juliet'."
"Who is the author of this play?" "William Shakespeare"
"Guacamole is a popular Mexican dish made with mashed avocados."
"What is the main ingredient?" "Avocado"

3、建立向量索引

將文檔分塊以后,通常需要對(duì)每個(gè)分塊建立索引用于后續(xù)的檢索。

常見的建立索引的方法如下:

其中,建立向量索引是當(dāng)下最為流行的一種方法。首先,通過embedding模型將高維度的數(shù)據(jù)映射到低維空間生成向量表示,再對(duì)這些向量進(jìn)行索引和搜索。

embedding模型需要根據(jù)任務(wù)的性質(zhì)和輸入數(shù)據(jù)的特點(diǎn)進(jìn)行選擇。以文本嵌入為例,早期的有Word2Vec、GloVe等模型,現(xiàn)在常用的有 Sentence TransformersOpenAI的text-embedding-ada-002等。為了更好地匹配數(shù)據(jù)類型和任務(wù)性質(zhì),還需要對(duì)embedding模型進(jìn)行微調(diào)處理。

為分塊的文檔生成向量表示后,通常采用相似度檢索的方式進(jìn)行查詢,可以采用內(nèi)積、歐式距離、余弦距離等方法,其中余弦距離最為常用。

在實(shí)際應(yīng)用中,建立向量索引和查詢存在以下需要考慮的問題,可能并不全面,提出來供大家討論:

1、向量化以后的數(shù)據(jù)膨脹問題

2、大規(guī)模向量相似性檢索的效率問題

4、大模型選擇與微調(diào)

目前已經(jīng)開源的大模型項(xiàng)目有很多,如何選擇適合的大模型,可結(jié)合任務(wù)類型、算力水平等因素綜合考慮,具體可參考之前的文章《該選多大參數(shù)量的大模型?》

如果基礎(chǔ)預(yù)訓(xùn)練大模型無法滿足在特定任務(wù)上的應(yīng)用要求,還需要對(duì)模型進(jìn)行微調(diào)。目前常用的高效微調(diào)方法主要有LoRA、P- Tuning、Prompt Tuning等,能夠以較低的數(shù)據(jù)量,以及算力和時(shí)間的投入取得較好的微調(diào)效果。

完成大模型微調(diào)以后,可以結(jié)合任務(wù)要求選擇適合的公開數(shù)據(jù)集進(jìn)行測(cè)評(píng),以驗(yàn)證微調(diào)效果。

二、開源知識(shí)庫項(xiàng)目

1. FastGPT

FastGPT是一個(gè)基于 LLM 大語言模型的知識(shí)庫問答系統(tǒng),提供開箱即用的數(shù)據(jù)處理、模型調(diào)用等能力。同時(shí)可以通過 Flow 可視化進(jìn)行工作流編排,從而實(shí)現(xiàn)復(fù)雜的問答場(chǎng)景。項(xiàng)目地址:https://github.com/labring/FastGPT

功能架構(gòu)圖如下??梢钥吹?,F(xiàn)astGPT可接入多種LLM,將存入知識(shí)庫的知識(shí)處理為QA對(duì)或問題的形式,向量化后存入數(shù)據(jù)庫。對(duì)話時(shí)將提問內(nèi)容向量化,在數(shù)據(jù)庫中進(jìn)行向量相似性搜索,將搜索到的內(nèi)容發(fā)送給LLM進(jìn)行輸出。

應(yīng)用FastGPT時(shí),首先要?jiǎng)?chuàng)建一個(gè)知識(shí)庫,在知識(shí)庫中上傳文檔后自動(dòng)生成QA對(duì)或分塊,然后再創(chuàng)建一個(gè)對(duì)話式的應(yīng)用并與創(chuàng)建的知識(shí)庫相關(guān)聯(lián),這樣大模型在回答時(shí)就能夠應(yīng)用到我們創(chuàng)建的知識(shí)庫中的知識(shí)。

2. Anything LLM

Anything LLM是一個(gè)開源的企業(yè)智能知識(shí)庫解決方案,能夠通過聊天的形式,快速地獲取曾經(jīng)喂給它的任何信息。

目前可以通過https://useanything.com/免費(fèi)試用。

使用步驟

  1. 選擇使用的大模型:目前提供OpenAI,Azure OpenAI和Claude 2三種大模型可供選擇,后續(xù)的版本中將允許用戶使用自己的大模型;
  2. 選擇向量數(shù)據(jù)庫:目前提供Chroma、Pinecone、Qdrant、Weaviate和LanceDB,默認(rèn)使用LanceDB;
  3. 可定制界面和使用方式:用戶可自定義logo;支持個(gè)人使用or團(tuán)隊(duì)使用,進(jìn)行相關(guān)配置即可;
  4. 創(chuàng)建workspace:用于上傳與LLM對(duì)話時(shí)需要用到的文檔;上傳的文檔可以在多個(gè)workspace中進(jìn)行復(fù)用。在workspace中可定義“temperature”這個(gè)參數(shù),它主要影響LLM回答的隨機(jī)性和創(chuàng)造性;此外,可以配置展示歷史對(duì)話的個(gè)數(shù),以及自定義對(duì)話的prompt。
  5. 進(jìn)行對(duì)話:對(duì)話時(shí)大模型能夠根據(jù)上傳的文檔進(jìn)行回答,并展示引用的文檔以及具體段落,確?;卮鹂尚趴伤菰?。

3. LangChain-Chatchat

LangChain-Chatchat(原LangChain-ChatGLM),基于ChatGLM等大模型與LangChain等應(yīng)用框架實(shí)現(xiàn),是一款開源、可離線部署的RAG大模型知識(shí)庫項(xiàng)目,能夠解決數(shù)據(jù)安全保護(hù)、私域化部署的企業(yè)痛點(diǎn)。

實(shí)現(xiàn)原理如下圖所示。過程包括加載文件 -> 讀取文本 -> 文本分割 -> 文本向量化 -> 問句向量化 -> 在文本向量中匹配出與問句向量最相似的 top k個(gè) -> 匹配出的文本作為上下文和問題一起添加到 prompt中 -> 提交給 LLM生成回答。

在最佳實(shí)踐中推薦的模型組合如下,用戶也可以根據(jù)需要自由選擇,目前項(xiàng)目支持的大模型、向量數(shù)據(jù)庫、開源embedding模型等非常豐富,可通過官方wiki進(jìn)行查看。

LLM: Chatglm2-6b

Embedding Models: m3e-base

TextSplitter: ChineseRecursiveTextSplitter

Kb_dataset: faiss

結(jié)語

基于RAG與LLM的知識(shí)庫作為目前最有潛力的企業(yè)端大模型應(yīng)用之一,從技術(shù)角度可以看到,建設(shè)方案已經(jīng)完備;從業(yè)務(wù)角度,最終的應(yīng)用效果和業(yè)務(wù)價(jià)值還需要觀察,并通過業(yè)務(wù)側(cè)的反饋不斷地促進(jìn)建設(shè)方案的進(jìn)一步優(yōu)化,比如增加對(duì)多模態(tài)知識(shí)的處理能力等。讓我們共同期待這類應(yīng)用普及那一天的到來。

參考資料

1、萬字長文:檢索增強(qiáng)LLM

2、RAG 分塊Chunk技術(shù)優(yōu)劣、技巧、方法匯總(五)

3、https://github.com/labring/FastGPT

4、https://github.com/Mintplex-Labs/anything-llm

5、hhttps://github.com/chatchat-space/Langchain-Chatchat/wiki

本文來源:

https://mp.weixin.qq.com/s/Tqj-traqFWogbQCUeCXtiw

https://mp.weixin.qq.com/s/RqD_4EaonrcaCg8pI6tNsw

熱門推薦
一個(gè)賬號(hào)試用1000+ API
助力AI無縫鏈接物理世界 · 無需多次注冊(cè)
3000+提示詞助力AI大模型
和專業(yè)工程師共享工作效率翻倍的秘密
返回頂部
上一篇
Coze API接口實(shí)戰(zhàn)應(yīng)用
下一篇
Android SDK 9.41熱點(diǎn):營銷卡片CDN緩存API秒開優(yōu)化方案
国内精品久久久久影院日本,日本中文字幕视频,99久久精品99999久久,又粗又大又黄又硬又爽毛片
亚洲欧美在线视频| 久久久久久久国产精品影院| 精品一区二区三区久久| av激情成人网| 国产精品久久久久四虎| 亚洲风情在线资源站| av电影一区二区| 国产精品蜜臀av| 国产大陆精品国产| 国产日韩欧美亚洲| 色婷婷久久综合| 亚洲在线视频一区| 制服丝袜亚洲色图| 国产一区二区三区视频在线播放| 麻豆视频一区二区| 久久夜色精品一区| 国产成人无遮挡在线视频| 中文字幕欧美国产| 色综合一个色综合| 国产精品久久久久影院色老大 | 亚洲小说欧美激情另类| 精品少妇一区二区三区在线播放| 黄色资源网久久资源365| 国产乱淫av一区二区三区| 日韩一区二区在线观看视频播放| 三级影片在线观看欧美日韩一区二区 | 精品国产乱码久久久久久蜜臀| 色综合久久中文综合久久97| 天天综合天天综合色| 欧美成人女星排名| 麻豆精品在线看| 亚洲视频一区二区在线观看| 欧美一区二区免费观在线| 国产69精品一区二区亚洲孕妇| 亚洲午夜激情网页| 中文字幕在线免费不卡| 91精品国产一区二区三区| 99精品视频一区二区| 国产精品一区在线| 久久99精品一区二区三区| 夜色激情一区二区| 日本一区二区视频在线| 日韩视频在线永久播放| 制服丝袜激情欧洲亚洲| 欧亚一区二区三区| 色香蕉久久蜜桃| 91网页版在线| 91日韩在线专区| 91丨porny丨国产入口| 97国产一区二区| 91麻豆精品在线观看| av高清不卡在线| 91丝袜美女网| 在线观看成人免费视频| 在线免费av一区| 精品视频123区在线观看| 欧美手机在线视频| 欧美一二三区在线观看| 日韩美女视频一区二区在线观看| 91.com在线观看| 制服丝袜激情欧洲亚洲| 精品久久久久久久久久久久包黑料 | 亚洲永久免费视频| 亚洲成人免费观看| 久久精品国产色蜜蜜麻豆| 狠狠网亚洲精品| 波多野洁衣一区| 欧美这里有精品| 精品国产一区二区三区久久影院 | 99国产麻豆精品| 欧美四级电影网| 欧美精品一区二| 亚洲视频一区在线观看| 亚洲国产裸拍裸体视频在线观看乱了| 亚洲综合av网| 国产精品亚洲专一区二区三区| 国产不卡一区视频| 色综合一个色综合亚洲| 在线播放欧美女士性生活| 欧美精品一区二区三区高清aⅴ | 国产露脸91国语对白| 亚洲啪啪综合av一区二区三区| 国产精品久久午夜| 天天色图综合网| 国产精品66部| 欧美日韩一区二区三区在线看| 精品日韩在线一区| 亚洲卡通欧美制服中文| 蜜臀久久99精品久久久画质超高清 | 色爱区综合激月婷婷| 中文天堂在线一区| 久久久精品影视| 91在线精品秘密一区二区| 日韩成人午夜精品| 日韩电影网1区2区| 一区二区三区在线观看动漫| 2欧美一区二区三区在线观看视频| 日韩美女视频在线| 一片黄亚洲嫩模| 欧美老女人第四色| 国产精品色在线| 免费欧美高清视频| 欧美午夜电影一区| 亚洲欧洲色图综合| 国产精品天天看| 美女诱惑一区二区| 欧美精品成人一区二区三区四区| 国产日韩v精品一区二区| 日韩精品成人一区二区在线| 91一区二区在线| 中文字幕在线不卡视频| 国产成人超碰人人澡人人澡| 精品免费视频.| 国产一区啦啦啦在线观看| 91精品欧美综合在线观看最新| 亚洲美女在线一区| 91香蕉视频污在线| 亚洲精品国产精品乱码不99| 国产成人精品1024| 国产亚洲精品aa午夜观看| 国产乱一区二区| 国产精品毛片无遮挡高清| 免费视频最近日韩| 欧美α欧美αv大片| 国产精品综合一区二区| 中文在线免费一区三区高中清不卡| 伦理电影国产精品| 久久久.com| 色悠悠亚洲一区二区| 夜夜嗨av一区二区三区| 欧美老女人第四色| 国产精品77777| 亚洲综合激情小说| 欧美xxxxxxxxx| 91女神在线视频| 免费观看在线综合色| 2020国产成人综合网| 不卡电影一区二区三区| 亚洲永久免费av| 精品黑人一区二区三区久久| 成人av在线一区二区| 亚洲成a人片在线观看中文| 精品少妇一区二区三区在线播放| av资源网一区| 久久99热狠狠色一区二区| 亚洲精品国产精华液| 精品久久久三级丝袜| 在线精品视频小说1| 久久激情综合网| 亚洲柠檬福利资源导航| 欧美va日韩va| 欧美丝袜丝交足nylons图片| 国产成人综合视频| 樱花影视一区二区| 亚洲国产精品黑人久久久 | 亚洲六月丁香色婷婷综合久久| 日韩区在线观看| 在线播放中文一区| 一本色道久久综合狠狠躁的推荐 | 亚洲国产三级在线| 国产精品久久久久久户外露出| 在线播放91灌醉迷j高跟美女| 成人av在线播放网站| 国产一区二区三区不卡在线观看| 婷婷国产v国产偷v亚洲高清| 亚洲少妇屁股交4| 国产精品久久久久久久蜜臀| 国产亚洲制服色| 国产区在线观看成人精品 | 精品亚洲成av人在线观看| 老司机免费视频一区二区三区| 日韩主播视频在线| 久久99久久久欧美国产| 老司机精品视频在线| 韩日av一区二区| 高清在线成人网| 色视频欧美一区二区三区| 欧美性色黄大片手机版| 欧美日韩三级视频| 日韩欧美第一区| 国产日韩一级二级三级| 中文字幕免费在线观看视频一区| 国产精品美女久久福利网站| 亚洲免费三区一区二区| 亚洲6080在线| 国内精品第一页| 99国产精品久久| 91精品国产综合久久久久| 精品区一区二区| 亚洲欧美视频一区| 蜜臀av性久久久久蜜臀aⅴ | 欧美一区2区视频在线观看| 久草中文综合在线| 99久久伊人久久99| 在线日韩国产精品| 亚洲精品一区二区精华| 国产精品成人一区二区三区夜夜夜| 一区二区三区鲁丝不卡| 九九**精品视频免费播放| 91农村精品一区二区在线|