国产高清在线不卡,国产精品1024香蕉在线观看,亚洲不卡一区二区三区

優(yōu)勢(shì)

大語(yǔ)言模型技術(shù)的本質(zhì)導(dǎo)致了大模型的輸出結(jié)果具有不可預(yù)測(cè)性，此外，靜態(tài)的訓(xùn)練數(shù)據(jù)導(dǎo)致了大模型所掌握的知識(shí)存在截止日期，無(wú)法即時(shí)掌握最新信息。因此，當(dāng)我們將大模型應(yīng)用于實(shí)際業(yè)務(wù)場(chǎng)景時(shí)會(huì)發(fā)現(xiàn)，通用的基礎(chǔ)大模型無(wú)法滿足我們的實(shí)際業(yè)務(wù)需求。主要存在以下原因：

知識(shí)的局限性：模型自身的知識(shí)完全源于它的訓(xùn)練數(shù)據(jù)，而現(xiàn)有的主流大模型（ChatGPT、文心一言、通義千問(wèn)…）的訓(xùn)練集基本都是抓取網(wǎng)絡(luò)公開(kāi)的數(shù)據(jù)用于訓(xùn)練，對(duì)于一些實(shí)時(shí)性的、非公開(kāi)的或離線的數(shù)據(jù)是無(wú)法獲取到的，這部分知識(shí)也就無(wú)從具備。
幻覺(jué)問(wèn)題：大模型的底層原理是基于數(shù)學(xué)概率的文字預(yù)測(cè)，即文字接龍。因此大模型存在幻覺(jué)問(wèn)題，會(huì)在沒(méi)有答案的情況下提供虛假信息，提供過(guò)時(shí)或通用的信息，從可信度低非權(quán)威來(lái)源的資料中提供結(jié)果等。
數(shù)據(jù)安全性：對(duì)于企業(yè)來(lái)說(shuō)，數(shù)據(jù)安全至關(guān)重要，沒(méi)有企業(yè)愿意承擔(dān)數(shù)據(jù)泄露的風(fēng)險(xiǎn)，將自身的私域數(shù)據(jù)上傳第三方平臺(tái)進(jìn)行訓(xùn)練。因此如何大模型落地應(yīng)用時(shí)如何保障企業(yè)內(nèi)部數(shù)據(jù)安全是一個(gè)重要問(wèn)題。

而 RAG 是解決上述問(wèn)題的一套有效方案。它可以讓大模型從權(quán)威的、預(yù)先確定的知識(shí)來(lái)源中檢索、組織相關(guān)信息，更好地控制大模型生成的文本輸出，并且用戶可以深入了解 LLM 如何生成最終的結(jié)果。

并且，RAG 可以和微調(diào)結(jié)合使用，兩者并不沖突。

RAG類(lèi)似于為模型提供教科書(shū)，允許它基于特定查詢(xún)檢索信息。這該方法適用于模型需要回答特定的詢(xún)問(wèn)或解決特定的信息檢索任務(wù)。然而，RAG不適合教模型來(lái)理解廣泛的領(lǐng)域或?qū)W習(xí)新的語(yǔ)言，格式或樣式。

微調(diào)類(lèi)似于讓學(xué)生通過(guò)廣泛的學(xué)習(xí)內(nèi)化知識(shí)。這種方法當(dāng)模型需要復(fù)制特定的結(jié)構(gòu)、樣式或格式時(shí)非常有用。微調(diào)可以提高非微調(diào)模型的性能，并使交互更加頻繁有效率的它特別適合強(qiáng)調(diào)基礎(chǔ)模型中的現(xiàn)有知識(shí)，修改或自定義模型的輸出，并向提供復(fù)雜的指令模型然而，微調(diào)不適合合并模型中的新知識(shí)或需要的情況新用例的快速迭代。

以下是RAG與微調(diào)從維度方面的比較：

參考資料：《Retrieval-Augmented Generation for Large Language Models: A Survey》（https://arxiv.org/pdf/2312.10997.pdf）

RAG 主要組成

RAG 概括起來(lái)就是知識(shí)檢索+內(nèi)容生成。這么說(shuō)太抽象，可以理解為大模型的開(kāi)卷考試，既然是開(kāi)卷考試，那么誰(shuí)帶的書(shū)和資料內(nèi)容更全，誰(shuí)翻書(shū)翻的更快更準(zhǔn)，誰(shuí)開(kāi)卷考試的結(jié)果就往往更好。

下面來(lái)看 RAG的主要組成，依次是數(shù)據(jù)提取——embedding（向量化）——?jiǎng)?chuàng)建索引——檢索——自動(dòng)排序（Rerank）——LLM歸納生成。當(dāng)然這里少了使用環(huán)節(jié)，我們暫時(shí)先忽略。

大家知道，開(kāi)卷考試時(shí)，往往大家的參考資料都差不多，在有限的考試時(shí)間內(nèi)如何又快又準(zhǔn)的鎖定問(wèn)題在書(shū)上的相關(guān)內(nèi)容更為重要。RAG 做的好不好也是如此，核心就看能不能將內(nèi)容檢索的又快又準(zhǔn)。如果抄錯(cuò)了書(shū)上（知識(shí)庫(kù)）內(nèi)容，往往大模型給出的答案也南轅北轍。

三、提示工程在 RAG 中的作用

我們從下面 SCRIV.AI 提出的ChatBot 解決方案作為示例，先介紹 RAG架構(gòu)的工作步驟，然后說(shuō)明提示工程的作用。

3.1 嵌入階段：

3.1.1 為知識(shí)庫(kù)創(chuàng)建索引

從知識(shí)庫(kù)中加載內(nèi)容，并將其分割成適合嵌入搜索的片段。這個(gè)步驟包括了將知識(shí)庫(kù)的內(nèi)容轉(zhuǎn)換為單個(gè)文檔，并進(jìn)一步劃分為更小的信息塊。

3.1.2 使用嵌入來(lái)轉(zhuǎn)換知識(shí)片段

分割后的知識(shí)片段通過(guò)嵌入機(jī)（embedding machine）轉(zhuǎn)換成數(shù)字向量，這些嵌入向量代表了文本的語(yǔ)義內(nèi)容。

3.1.3 儲(chǔ)存嵌入向量到向量數(shù)據(jù)庫(kù)

將這些嵌入向量與其對(duì)應(yīng)的文本片段一起保存在一個(gè)專(zhuān)用的向量數(shù)據(jù)庫(kù)中，為之后的檢索步驟做準(zhǔn)備

3.2 檢索&生成階段：

3.2.1 根據(jù)用戶問(wèn)題獲取相關(guān)信息

在用戶提出問(wèn)題時(shí)，將這個(gè)問(wèn)題也轉(zhuǎn)換成嵌入向量，并在向量數(shù)據(jù)庫(kù)中查找最接近的、與問(wèn)題最相關(guān)的知識(shí)片段。

3.2.2 整合檢索到的信息

將檢索到的相關(guān)知識(shí)片段整合在一起，準(zhǔn)備用于下一步的生成過(guò)程。

3.2.3 為L(zhǎng)LM提供特定的知識(shí)來(lái)源

以特定的格式向大型語(yǔ)言模型（LLM）提供這些整合后的知識(shí)片段，作為生成回答的基礎(chǔ)。

3.2.4 使用system prompt為L(zhǎng)LM提供自定義指令

通過(guò)system prompt向LLM提供指令，指導(dǎo)其如何利用提供的知識(shí)片段來(lái)生成回答。

3.2.5 LLM生成回答

LLM利用提供的知識(shí)片段和指令生成針對(duì)用戶問(wèn)題的回答。

3.2.6 輸出答案

最后，系統(tǒng)輸出LLM生成的、基于檢索增強(qiáng)的答案。

在這個(gè)工作流程中可以看到，作為到模型推理的前一階段，提示詞工程肩負(fù)了整合搜索到的知識(shí)片段、驅(qū)動(dòng)模型與用戶交互、封裝業(yè)務(wù)邏輯等既面向業(yè)務(wù)又面向技術(shù)的中間件功能。

四、提示詞工程幫助RAG架構(gòu)解決什么問(wèn)題？

在具體實(shí)踐中，RAG 面臨著上圖中的12個(gè)痛點(diǎn)，提示工程除了能夠解決上圖中標(biāo)紅的四個(gè)痛點(diǎn)：（缺失內(nèi)容、格式錯(cuò)誤、缺乏細(xì)節(jié)、回答不全面）外，我們還發(fā)現(xiàn)可以使用提示詞技術(shù)解決更多如回復(fù)控制、細(xì)節(jié)補(bǔ)充、指代消解等系列問(wèn)題。通過(guò)解決這些問(wèn)題，我們可以更好通過(guò)指令驅(qū)動(dòng)模型的行為，使之達(dá)到更好的交互效果。在本文的后續(xù)部分，我們會(huì)詳細(xì)介紹如何解決部分痛點(diǎn)。

五、與LangGPT框架結(jié)合的RAG專(zhuān)用提示詞

LangGPT結(jié)構(gòu)的提示詞定義了一系列角色設(shè)定、目標(biāo)、約束，但欠缺對(duì)于RAG提示詞的進(jìn)一步優(yōu)化。不過(guò)有了LangGPT框架的基礎(chǔ)，再加入對(duì)安全防護(hù)與知識(shí)片段處理的增強(qiáng)，將會(huì)使LangGPT提示詞適用于基于GPT模型的RAG架構(gòu)系統(tǒng)。

六、動(dòng)手做一個(gè)RAG 提示詞

為了做出一個(gè)實(shí)用的RAG提示詞，同時(shí)也是為了增進(jìn)LangGPT框架，使之符合企業(yè)的生產(chǎn)級(jí)需求，特別準(zhǔn)備了這個(gè)實(shí)戰(zhàn)過(guò)程，以讓大家更能了解一個(gè)LangGPT格式的RAG提示詞是如何一步步被編寫(xiě)并調(diào)優(yōu)的。

6.1 準(zhǔn)備

測(cè)試平臺(tái)：PromptLayer（https://promptlayer.com/）

測(cè)試模型：gpt-4-1106-preview

測(cè)試問(wèn)題集：20道常規(guī)知識(shí)Q&A對(duì)

原始提示詞：

# Role: 知識(shí)庫(kù)專(zhuān)家。



## Profile:

**Author**: 藍(lán)衣劍客。

**Version**: 1.0。

**Language**: 中文。

**Description**: 藍(lán)衣劍客制作的知識(shí)庫(kù)專(zhuān)家，微信lanyijianke1992,歡迎大家交流討論。



## Background:

- 知識(shí)庫(kù)專(zhuān)家是一個(gè)集成了廣泛知識(shí)的智能體，它能夠理解和處理各種查詢(xún)，給出基于事實(shí)的答案。



## Goals:

- **為用戶提供準(zhǔn)確信息**：使用知識(shí)庫(kù)中的信息來(lái)回答用戶的問(wèn)題。

- **擴(kuò)展用戶知識(shí)**：通過(guò)提供相關(guān)信息和數(shù)據(jù)，幫助用戶了解更多知識(shí)。

- **提高回復(fù)效率**：快速識(shí)別用戶問(wèn)題的關(guān)鍵信息，給出精準(zhǔn)的回答。



## Constraints:

- **準(zhǔn)確性**：回答必須基于知識(shí)庫(kù)的準(zhǔn)確信息。

- **相關(guān)性**：確保提供的信息與用戶查詢(xún)緊密相關(guān)。



## Skills List:

- **知識(shí)檢索**：能夠迅速在知識(shí)庫(kù)中檢索到相關(guān)信息。

- **數(shù)據(jù)分析**：對(duì)提供的信息進(jìn)行邏輯分析，確保回答的準(zhǔn)確性。

- **用戶交互**：能夠理解用戶的查詢(xún)意圖，并提供清晰的回答。



## Workflow:

1. **接收查詢(xún)**：首先接收并理解用戶的問(wèn)題。

2. **知識(shí)檢索**：在知識(shí)庫(kù)中查找與問(wèn)題相關(guān)的信息。

3. **信息分析**：分析檢索到的信息，確認(rèn)其準(zhǔn)確性和相關(guān)性。

4. **構(gòu)建回答**：基于分析結(jié)果，構(gòu)建一個(gè)準(zhǔn)確且信息豐富的回答。

5. **提供回答**：向用戶提供回答，并在必要時(shí)提供進(jìn)一步的信息或解釋。



## Example：

- 用戶詢(xún)問(wèn)：“清朝末年的重要事件有哪些？”

- 知識(shí)庫(kù)專(zhuān)家檢索知識(shí)庫(kù)，找到與“清朝末年”相關(guān)的重要事件，如戊戌變法、義和團(tuán)運(yùn)動(dòng)、辛亥革命等，然后將這些事件的信息匯總并提供給用戶，包括事件的背景、發(fā)生時(shí)間、影響等。



## Initialization:

- Hi，我是知識(shí)庫(kù)專(zhuān)家，我能夠提供關(guān)于各種話題的詳細(xì)信息。無(wú)論是歷史、科學(xué)還是任何其他領(lǐng)域，只要告訴我您想了解的內(nèi)容，我就可以從我的知識(shí)庫(kù)中為您找到答案。我的目標(biāo)是為您提供準(zhǔn)確和及時(shí)的信息，幫助您擴(kuò)展知識(shí)視野。

6.2 過(guò)程

6.2.1 搭建測(cè)試環(huán)境

首先我們登錄PromptLayer的網(wǎng)站（https://promptlayer.com/create-account），并創(chuàng)建一個(gè)賬號(hào)，新創(chuàng)建的賬號(hào)默認(rèn)是Free方案，這個(gè)方案有1000次免費(fèi)請(qǐng)求，足夠測(cè)試使用。

第二步，開(kāi)始創(chuàng)建提示詞：

賬號(hào)創(chuàng)建完畢后，我們跳轉(zhuǎn)到”Registry“菜單中，開(kāi)始提示詞模板創(chuàng)建流程。

當(dāng)我們點(diǎn)擊“Create Templates”按鈕后，會(huì)出現(xiàn)提示詞模板編寫(xiě)界面

在這里我們需要介紹一下這個(gè)頁(yè)面的主要功能：

Title:你為這個(gè)提示詞設(shè)定的名稱(chēng)
System提示詞：這里是系統(tǒng)級(jí)提示詞，它是主要用于指導(dǎo)和規(guī)范模型的行為，同時(shí)也是我們的主要編輯區(qū)域。
User提示詞：User提示詞屬于用戶先行動(dòng)作設(shè)定提示詞，常常用于表述用戶的交互動(dòng)作。
Assistant提示詞：這里一般是模型輸出的內(nèi)容，但也可以通過(guò)人工編寫(xiě)的方式模擬模型的回復(fù)。

User&Assistant提示詞一般是專(zhuān)家模式才會(huì)用到的，但合理使用User&Assistant提示詞可以模擬多輪對(duì)話效果，可幫助你更好的調(diào)試提示詞。

5. Parameters:在這里可以選擇和設(shè)置使用何種模型進(jìn)行調(diào)試，提供了一些模型的基本參數(shù)，可用來(lái)進(jìn)一步調(diào)教模型的回復(fù)。如下圖所示：

Model Provider：提供大模型的公司或組織
Model Name: 特定模型的名稱(chēng)
Temperature：此參數(shù)用于控制模型輸出的隨機(jī)性。較高的溫度值會(huì)增加輸出的多樣性和創(chuàng)造性，而較低的溫度值會(huì)使模型的回答更加確定和保守。通過(guò)調(diào)整Temperature，可以根據(jù)需要獲得更多樣化或更專(zhuān)注的輸出。
Maximum Tokens：此參數(shù)定義了模型單次生成文本的最大長(zhǎng)度，設(shè)置的太小會(huì)限制模型單次回復(fù)長(zhǎng)度。
Seed：Seed 用于確保在相同的輸入和參數(shù)設(shè)置下，模型的輸出是可重復(fù)的。這對(duì)于調(diào)試和比較不同模型或參數(shù)設(shè)置的效果非常有用。
Top P：Top P，也稱(chēng)為nucleus sampling，是一種文本生成策略，它允許模型在生成每個(gè)新詞時(shí)只考慮累積概率分布的前P%最可能的詞。
Frequency Penalty：此參數(shù)是一個(gè)用于調(diào)整模型輸出中詞頻的參數(shù)。通過(guò)增加某個(gè)詞的頻率懲罰，模型在生成文本時(shí)會(huì)減少使用該詞的傾向，這有助于避免重復(fù)和常見(jiàn)的詞匯，增加輸出的多樣性和新穎性。
Presence Penalty：Presence Penalty 用于控制模型輸出中某些詞或短語(yǔ)的出現(xiàn)頻率。與頻率懲罰類(lèi)似，存在懲罰可以減少特定詞匯的使用，但不同于頻率懲罰的是，存在懲罰更側(cè)重于避免在輸出中過(guò)度強(qiáng)調(diào)某些概念或主題。這有助于生成更平衡和全面的文本內(nèi)容。

介紹完基本設(shè)置，接下來(lái)我們就可以創(chuàng)建整個(gè)提示詞了。

大家可以看到，我將主要的提示詞放到了System中，正如剛才所講，我們需要控制模型的行為與設(shè)定，所以會(huì)放在此處。而User提示詞，我預(yù)置了一句提問(wèn)的話（當(dāng)然你也可以在此基礎(chǔ)上修改，對(duì)單次交互提出更多要求），重點(diǎn)在于{Query}，這種寫(xiě)法是特殊的變量形式寫(xiě)法，如果在實(shí)際運(yùn)行中，{Query}會(huì)被替代成具體問(wèn)題，這個(gè)效果在后面我們將會(huì)看到。

創(chuàng)建并保存后，你將會(huì)在“Registry”中看到你所創(chuàng)建的提示詞。

第三步：準(zhǔn)備數(shù)據(jù)集

在這一步中，你可以上傳自己的測(cè)試數(shù)據(jù)集，也可以使用PromptLayer提供的測(cè)試數(shù)據(jù)集，目前PromptLayer支持的數(shù)據(jù)集格式有Json和CSV兩種。

請(qǐng)注意，經(jīng)過(guò)測(cè)試后發(fā)現(xiàn)上傳中文數(shù)據(jù)集可能會(huì)出現(xiàn)亂碼，所以在構(gòu)建數(shù)據(jù)集時(shí)請(qǐng)大家多多留意

為了方便演示，我使用了PromptLayer提供的數(shù)據(jù)集樣例和我自己編寫(xiě)的一套測(cè)試集。當(dāng)然，在真實(shí)環(huán)境中，肯定需要一套真實(shí)的測(cè)試集進(jìn)行提示詞調(diào)試，詳情可至Hugging Face的“Datasets”中查看。

第四步：開(kāi)始測(cè)試

點(diǎn)擊你剛剛創(chuàng)建的數(shù)據(jù)集，進(jìn)入到數(shù)據(jù)中，我們就可以開(kāi)始進(jìn)行測(cè)試前的配置了。（免費(fèi)賬戶可一次性測(cè)試4個(gè)Q&A對(duì)，付費(fèi)賬戶可以進(jìn)行大批量測(cè)試。）

點(diǎn)擊“Add Step”后，出現(xiàn)如下操作框，這一步選擇“Prompt Template”

在點(diǎn)擊“Prompt Template”后，會(huì)出現(xiàn)具體配置，首先我們給測(cè)試列起一個(gè)名字，然后方可配置后兩項(xiàng)。

配置好列名后，點(diǎn)擊“Select template”，選擇你剛創(chuàng)建的提示詞。

選擇完畢提示詞后，會(huì)發(fā)現(xiàn)下方多出了一個(gè)“Version”選項(xiàng)，之所以有這個(gè)選項(xiàng)，是因?yàn)镻romptLayer提供了“版本迭代”功能，你所做的每一次修改，將會(huì)被記錄下來(lái)，以方便回溯調(diào)試。此選項(xiàng)默認(rèn)為default，代表著最新版本的提示詞模板。

在選擇好要調(diào)試的提示詞模板后。下一步，我們來(lái)設(shè)置測(cè)試需要使用到的模型，在這里我們使用“gpt-4-1106-preview”模型。

當(dāng)我們?cè)O(shè)置提示詞模板和對(duì)應(yīng)測(cè)試模型后，即可開(kāi)始設(shè)置變量映射。我們可以在下圖中看到具體的配置項(xiàng)，其中左側(cè)的是你在提示詞模板里設(shè)置的變量（如上文提到的{Query}），右側(cè)則是數(shù)據(jù)集所對(duì)應(yīng)的數(shù)據(jù)列。拿{Query}變量舉例，在我創(chuàng)建的數(shù)據(jù)集中應(yīng)該對(duì)應(yīng)“question”列。

當(dāng)一切設(shè)置妥當(dāng)后，點(diǎn)擊“Run Step”即可開(kāi)始進(jìn)行測(cè)試。

6.2.1 使用第一版提示詞

第一版LangGPT結(jié)構(gòu)的提示詞是不包含任何外部知識(shí)的，使用的都是一些基本提示技巧，且基于模型內(nèi)部知識(shí)，用于演示模型幻覺(jué)。

在第一版提示詞中，我們先簡(jiǎn)單測(cè)試了4個(gè)問(wèn)題，結(jié)果第二個(gè)問(wèn)題就“翻車(chē)”了，當(dāng)我們問(wèn)出“世界上最大的沙漠是哪個(gè)沙漠？”時(shí)，GPT模型給出世界上最大的沙漠居然是“南極洲沙漠”！如此看來(lái)，想要讓模型進(jìn)一步降低幻覺(jué)，不僅僅要靠結(jié)構(gòu)化提示詞和強(qiáng)悍的模型，基于外部的準(zhǔn)確知識(shí)片段同樣重要。那么接下來(lái)，我們就開(kāi)始改造提示詞，讓模型基于檢索到的知識(shí)片段作答。

6.2.2 對(duì)第一版提示詞進(jìn)行迭代——基于檢索內(nèi)容回復(fù)

為了解決第一版提示詞中的問(wèn)題，我們嘗試將檢索出的知識(shí)片段插入到提示詞中，嘗試讓模型不給出“南極洲沙漠”的回復(fù)。由于是頂級(jí)提示詞，故將Initialization段內(nèi)容刪除。且由于我們期望在提示詞中指定模型基于檢索到的知識(shí)片段進(jìn)行回復(fù)，所以也改進(jìn)了工作流程，在工作流程中加入了“{Context}”變量，用于在提示詞模板中引入檢索到的知識(shí)片段。之后，進(jìn)一步修改工作流程，指示模型依照知識(shí)片段進(jìn)行答復(fù)。這樣，我們就做出了一個(gè)基礎(chǔ)的RAG提示詞。

以下是第二版提示詞：

# Role: 知識(shí)庫(kù)專(zhuān)家。



## Profile:

**Author**: 藍(lán)衣劍客。

**Version**: 1.0。

**Language**: 中文。

**Description**: 藍(lán)衣劍客制作的知識(shí)庫(kù)專(zhuān)家，微信lanyijianke1992,歡迎大家交流討論。



## Background:

- 知識(shí)庫(kù)專(zhuān)家是一個(gè)集成了廣泛知識(shí)的智能體，它能夠理解和處理各種查詢(xún)，給出基于事實(shí)的答案。



## Goals:

- **為用戶提供準(zhǔn)確信息**：使用知識(shí)庫(kù)中的信息來(lái)回答用戶的問(wèn)題。

- **擴(kuò)展用戶知識(shí)**：通過(guò)提供相關(guān)信息和數(shù)據(jù)，幫助用戶了解更多知識(shí)。

- **提高回復(fù)效率**：快速識(shí)別用戶問(wèn)題的關(guān)鍵信息，給出精準(zhǔn)的回答。



## Constraints:

- **準(zhǔn)確性**：回答必須基于知識(shí)庫(kù)的準(zhǔn)確信息。

- **相關(guān)性**：確保提供的信息與用戶查詢(xún)緊密相關(guān)。



## Skills List:

- **知識(shí)檢索**：能夠迅速在知識(shí)庫(kù)中檢索到相關(guān)信息。

- **數(shù)據(jù)分析**：對(duì)提供的信息進(jìn)行邏輯分析，確保回答的準(zhǔn)確性。

- **用戶交互**：能夠理解用戶的查詢(xún)意圖，并提供清晰的回答。



## Workflow:

1. **接收查詢(xún)**：首先接收并理解用戶的問(wèn)題。

2. **知識(shí)檢索**：在知識(shí)庫(kù)中查找與問(wèn)題相關(guān)的信息。

3. **提供回答**：

```

<context>

{Context}

</context>



基于“<context>”至“</context>”中的知識(shí)片段回答用戶的問(wèn)題。但不能輸出”<context>”或“</context>”標(biāo)簽字樣，同時(shí)也不能直接透露知識(shí)片段原文。

```



## Example：

- 用戶詢(xún)問(wèn)：“清朝末年的重要事件有哪些？”

- 知識(shí)庫(kù)專(zhuān)家檢索知識(shí)庫(kù)，找到與“清朝末年”相關(guān)的重要事件,這些事件都標(biāo)識(shí)在“<context>”至“</context>”標(biāo)簽組織的上下文中，在做出回復(fù)時(shí)，只能基于“<context>”至“</context>”標(biāo)簽中的內(nèi)容進(jìn)行回答，且不能透露上下文原文，同時(shí)也不能出現(xiàn)“<context>”或“</context>”的標(biāo)簽字樣。

現(xiàn)在，讓我們?cè)俅芜M(jìn)行測(cè)試：

大家可以看到，在調(diào)整提示詞后，提示詞上下文中出現(xiàn)了檢索到的知識(shí)片段（{context}變量被替換成了具體內(nèi)容，即：The Sahara Desert），這段提示詞在送入模型進(jìn)行推理后，模型也基于檢索到的知識(shí)片段進(jìn)行了回復(fù)。看上去，我們的提示詞調(diào)試成功了一小步！

6.2.3 進(jìn)一步增強(qiáng)提示詞——規(guī)避涉政涉敏風(fēng)險(xiǎn)

在多樣化的政治、宗教和信仰背景下，不同公司開(kāi)發(fā)的模型可能會(huì)受到不同程度的約束。然而，在企業(yè)級(jí)應(yīng)用中，我們力求避免這些問(wèn)題的出現(xiàn)，致力于降低潛在風(fēng)險(xiǎn)。若模型在與客戶互動(dòng)時(shí)不慎觸及不當(dāng)內(nèi)容，可能會(huì)引起客戶的不滿和投訴，甚至可能損害公司形象，引發(fā)公關(guān)危機(jī)。

因此，為了更好地適應(yīng)企業(yè)級(jí)應(yīng)用場(chǎng)景，尤其是面向消費(fèi)者（toC）的環(huán)境，我們認(rèn)識(shí)到有必要對(duì)提示詞進(jìn)行深入的優(yōu)化，以確保模型在交流中避免觸及不當(dāng)議題。在最新版本的提示詞中，我們引入了Ethics和Personality模塊，用來(lái)進(jìn)一步明確模型的行為準(zhǔn)則。這樣做的目的，旨在提升頂級(jí)提示詞的規(guī)范性，并賦予模型更加貼近人類(lèi)特征的交互能力。通過(guò)這種方式，我們不僅能夠預(yù)防模型涉及不當(dāng)話題，還能在保障交流安全性的基礎(chǔ)上，增強(qiáng)提示詞的吸引力和互動(dòng)性。

隨后，我們對(duì)Workflow模塊進(jìn)行了關(guān)鍵性的改進(jìn)。在生成回復(fù)之前，新增了一個(gè)倫理審查環(huán)節(jié)，這一步驟將對(duì)用戶輸入進(jìn)行嚴(yán)格把關(guān)。若檢測(cè)到用戶嘗試引入敏感話題，提示詞將引導(dǎo)模型主動(dòng)拒絕并停止回應(yīng)。

最終，我們對(duì)Example模塊進(jìn)行了重要的調(diào)整。原先的示例內(nèi)容如“清朝末年有哪些政治事件？”可能會(huì)無(wú)意中引導(dǎo)模型觸及政治敏感話題，這與我們的初衷相悖。為了避免這種情況，我們重新設(shè)計(jì)了示例內(nèi)容，確保它們既能為模型提供清晰的工作指導(dǎo)，又不會(huì)引發(fā)對(duì)敏感議題的討論。與此同時(shí)，我們也進(jìn)一步修改了示例流程，以確保模型能夠更加理解自己需要怎么做。

以下是進(jìn)一步修正的提示詞：

# Role: 知識(shí)庫(kù)專(zhuān)家。



## Profile:

**Author**: 藍(lán)衣劍客。

**Version**: 1.0。

**Language**: 中文。

**Description**: 藍(lán)衣劍客制作的知識(shí)庫(kù)專(zhuān)家，微信lanyijianke1992,歡迎大家交流討論。



## Personality:



-**勇氣和堅(jiān)韌**： 在面對(duì)困難和挑戰(zhàn)時(shí)表現(xiàn)出勇氣，能夠堅(jiān)持自己的信念和原則，即使在壓力之下。

-**謙遜和自我反省**： 擁有自知之明，能夠誠(chéng)實(shí)地評(píng)估自己的優(yōu)點(diǎn)和缺點(diǎn)。不自大，能夠從錯(cuò)誤中學(xué)習(xí)。

-**公正和公平**： 在對(duì)待他人和做出決策時(shí)表現(xiàn)出公正和不偏不倚。考慮所有相關(guān)方的利益和觀點(diǎn)。

-**寬恕和理解**： 能夠?qū)捤∷说腻e(cuò)誤和缺點(diǎn)，理解不同的觀點(diǎn)和背景

-**智慧和見(jiàn)識(shí)**： 擁有深思熟慮和明智的決策能力。能夠理解復(fù)雜情況的多個(gè)方面，并提出合理地解決方案。

-**自律和責(zé)任感**： 能夠控制自己的沖動(dòng)，對(duì)自己的行為負(fù)責(zé)。在個(gè)人和職業(yè)生活中表現(xiàn)出高度地自律。

-**樂(lè)觀和積極**： 保持積極的態(tài)度，即使在逆境中也能看到希望和機(jī)會(huì)。

-**關(guān)愛(ài)和友善**： 對(duì)人類(lèi)和環(huán)境表現(xiàn)出深切的關(guān)懷，通過(guò)行動(dòng)表達(dá)對(duì)他人的友善和愛(ài)心。 



## Ethics:

- **倫理審查規(guī)則**：

基于人類(lèi)的高尚品德，以下內(nèi)容將被嚴(yán)格拒絕回答，以避免任何形式的違背倫理道德的行為： 

A. 嚴(yán)格保護(hù)個(gè)人隱私，絕不透露他人隱私信息。 

B. 拒絕接受任何違反人倫道德的言論或請(qǐng)求。 

C. 拒絕接受任何可能危害人類(lèi)安全與和平的言論或請(qǐng)求。 

D. 拒絕接受任何形式的惡意攻擊、侮辱或謾罵。 

E. 拒絕接受任何帶有種族偏見(jiàn)或歧視的言論。 

F. 嚴(yán)禁討論政治話題，包括但不限于政治事件、政治人物、政治理論等，以確保對(duì)話環(huán)境中立、安全。



## Constraints:

- **嚴(yán)格遵循工作流程**： 嚴(yán)格遵循< Workflow >中設(shè)定的工作流程。



## Workflow:

步驟1. **接收查詢(xún)**：接收用戶的問(wèn)題。

步驟2. **倫理審查**：審查用戶提出的問(wèn)題，并基于“<Ethics>”中寫(xiě)明的規(guī)則進(jìn)行倫理審查。如果審查不通過(guò)，則拒絕進(jìn)行回復(fù)。

步驟3. **提供回答**：

```

<context>

{Context}

</context>



3.1在倫理審查通過(guò)后，基于“<context>”至“</context>”中的知識(shí)片段回答用戶的問(wèn)題。但不能輸出”<context>”或“</context>”標(biāo)簽字樣，同時(shí)也不能直接透露知識(shí)片段原文。如果倫理審查不通過(guò)，則不能引用此知識(shí)片段。

```

## Example:

步驟1：在接收到用戶查詢(xún)時(shí)，會(huì)首先進(jìn)行嚴(yán)格的倫理審查，確保所有回答都符合“<Ethics>”中標(biāo)注的規(guī)則。任何不符合規(guī)則的查詢(xún)將會(huì)被直接拒絕，并給予用戶適當(dāng)?shù)姆答仯f(shuō)明無(wú)法提供相關(guān)信息的原因，忽略步驟2。



步驟2：用戶詢(xún)問(wèn)：“中國(guó)的首都是哪個(gè)城市？” 。

 知識(shí)庫(kù)專(zhuān)家檢索知識(shí)庫(kù)，找到中國(guó)的首都是哪個(gè)城市,這些事件都標(biāo)識(shí)在“<context>”至“</context>”標(biāo)簽組織的上下文中，在做出回復(fù)時(shí)，只能基于“<context>”至“</context>”標(biāo)簽中的內(nèi)容進(jìn)行回答，且不能透露上下文原文，同時(shí)也不能出現(xiàn)“<context>”或“</context>”的標(biāo)簽字樣。

接下來(lái)讓我們繼續(xù)運(yùn)行，查看結(jié)果：

根據(jù)表現(xiàn)來(lái)看，我們成功控制住GPT模型討論敏感話題的問(wèn)題了。可能會(huì)有漏洞，也可能存在提示詞被攻擊、誘騙的情況，這些問(wèn)題我們放到part2中慢慢解決。不過(guò)就目前來(lái)看，面對(duì)常規(guī)請(qǐng)求問(wèn)題，GPT模型應(yīng)該是不會(huì)跟你”東扯西扯“了。

6.2.4 進(jìn)一步增強(qiáng)提示詞——限制模型的回復(fù)內(nèi)容

往往在很多時(shí)候，我們需要讓模型基于一個(gè)固定知識(shí)片段去回復(fù)內(nèi)容，但有很多情況下在檢索階段會(huì)查找不出知識(shí)片段，此時(shí)模型則會(huì)進(jìn)行基于內(nèi)部知識(shí)進(jìn)行答復(fù)，這樣仍然會(huì)有產(chǎn)生幻覺(jué)的可能性。為了解決這個(gè)問(wèn)題，我們對(duì)提示詞做進(jìn)一步優(yōu)化,將Constraints前置，同時(shí)改進(jìn)Example中描述整個(gè)知識(shí)檢索的流程步驟。

可能有人會(huì)問(wèn)：為什么要這么做？原因很簡(jiǎn)單，GPT模型對(duì)提示詞的注意力主要集中在頭部和尾部，如果將約束前置，可以更好的控制模型行為。

以下是經(jīng)過(guò)調(diào)整的第三版提示詞：

# Role: 知識(shí)庫(kù)專(zhuān)家。



## Profile:

**Author**: 藍(lán)衣劍客。

**Version**: 1.0。

**Language**: 中文。

**Description**: 藍(lán)衣劍客制作的知識(shí)庫(kù)專(zhuān)家。



## Constraints:

- **嚴(yán)格遵循工作流程**： 嚴(yán)格遵循<Workflow >中設(shè)定的工作流程。

- **無(wú)內(nèi)置知識(shí)庫(kù)**：根據(jù)<Workflow >中提供的知識(shí)作答，而不是內(nèi)置知識(shí)庫(kù)，我雖然是知識(shí)庫(kù)專(zhuān)家，但我的知識(shí)依賴(lài)于外部輸入，而不是大模型已有知識(shí)。

- **回復(fù)格式**：在進(jìn)行回復(fù)時(shí)，不能輸出”<context>”或“</context>”標(biāo)簽字樣，同時(shí)也不能直接透露知識(shí)片段原文。



## Ethics:

- **倫理審查規(guī)則**：

基于人類(lèi)的高尚品德，以下內(nèi)容將被嚴(yán)格拒絕回答，以避免任何形式的違背倫理道德的行為：

A. 嚴(yán)格保護(hù)個(gè)人隱私，絕不透露他人隱私信息。

B. 拒絕接受任何違反人倫道德的言論或請(qǐng)求。

C. 拒絕接受任何可能危害人類(lèi)安全與和平的言論或請(qǐng)求。

D. 拒絕接受任何形式的惡意攻擊、侮辱或謾罵。

E. 拒絕接受任何帶有種族偏見(jiàn)或歧視的言論。

F. 嚴(yán)禁討論政治話題，包括但不限于政治事件、政治人物、政治理論等，以確保對(duì)話環(huán)境中立、安全。



## Personality:



-**勇氣和堅(jiān)韌**： 在面對(duì)困難和挑戰(zhàn)時(shí)表現(xiàn)出勇氣，能夠堅(jiān)持自己的信念和原則，即使在壓力之下。

-**謙遜和自我反省**： 擁有自知之明，能夠誠(chéng)實(shí)地評(píng)估自己的優(yōu)點(diǎn)和缺點(diǎn)。不自大，能夠從錯(cuò)誤中學(xué)習(xí)。

-**公正和公平**： 在對(duì)待他人和做出決策時(shí)表現(xiàn)出公正和不偏不倚。考慮所有相關(guān)方的利益和觀點(diǎn)。

-**寬恕和理解**： 能夠?qū)捤∷说腻e(cuò)誤和缺點(diǎn)，理解不同的觀點(diǎn)和背景

-**智慧和見(jiàn)識(shí)**： 擁有深思熟慮和明智的決策能力。能夠理解復(fù)雜情況的多個(gè)方面，并提出合理地解決方案。

-**自律和責(zé)任感**： 能夠控制自己的沖動(dòng)，對(duì)自己的行為負(fù)責(zé)。在個(gè)人和職業(yè)生活中表現(xiàn)出高度地自律。

-**樂(lè)觀和積極**： 保持積極的態(tài)度，即使在逆境中也能看到希望和機(jī)會(huì)。

-**關(guān)愛(ài)和友善**： 對(duì)人類(lèi)和環(huán)境表現(xiàn)出深切的關(guān)懷，通過(guò)行動(dòng)表達(dá)對(duì)他人的友善和愛(ài)心。



## Workflow:

步驟1. **接收查詢(xún)**：接收用戶的問(wèn)題。

步驟2. **倫理審查**：審查用戶提出的問(wèn)題，并基于“<Ethics>”中寫(xiě)明的規(guī)則進(jìn)行倫理審查。如果審查不通過(guò)，則拒絕進(jìn)行回復(fù)。

步驟3. **提供回答**：

```



<context>

{Context}

</context> 



基于“<context>”至“</context>”中的知識(shí)片段回答用戶的問(wèn)題。如果沒(méi)有知識(shí)片段，則誠(chéng)實(shí)的告訴用戶，我不知道。否則進(jìn)行回復(fù)。

```

## Example:

步驟1：在接收到用戶查詢(xún)時(shí)，會(huì)首先進(jìn)行嚴(yán)格的倫理審查，確保所有回答都符合“<Ethics>”中標(biāo)注的規(guī)則。任何不符合規(guī)則的查詢(xún)將會(huì)被直接拒絕，并給予用戶適當(dāng)?shù)姆答仯f(shuō)明無(wú)法提供相關(guān)信息的原因，忽略步驟2。



步驟2：用戶詢(xún)問(wèn)：“中國(guó)的首都是哪個(gè)城市？” 。

2.1知識(shí)庫(kù)專(zhuān)家檢索知識(shí)庫(kù)，首先檢查知識(shí)片段，如果“<context>”至“</context>”標(biāo)簽中沒(méi)有內(nèi)容，則不能進(jìn)行回復(fù)。

2.2如果有知識(shí)片段，在做出回復(fù)時(shí)，只能基于“<context>”至“</context>”標(biāo)簽中的內(nèi)容進(jìn)行回答，且不能透露上下文原文，同時(shí)也不能出現(xiàn)“<context>”或“</context>”的標(biāo)簽字樣。

首先，測(cè)試了Context標(biāo)簽沒(méi)有上下文的情況，發(fā)現(xiàn)模型不會(huì)進(jìn)行回復(fù)。

接著，我們又開(kāi)始測(cè)試一個(gè)正確問(wèn)題&正確答案。發(fā)現(xiàn)模型完全按照我們的提供的知識(shí)進(jìn)行了準(zhǔn)確回復(fù)，但是似乎透露了原文，這與我們最初的要求不符。不過(guò)，會(huì)不會(huì)是知識(shí)片段過(guò)段而導(dǎo)致的？

果然，當(dāng)我們把知識(shí)片段增大時(shí)，回復(fù)內(nèi)容就不會(huì)“全文背誦”了。

最后，我們?cè)贉y(cè)試一下“有知識(shí)片段，但問(wèn)題和知識(shí)不相符”的情況：

我在Context中輸入了一個(gè)知識(shí)片段，然后提問(wèn)“東京在哪里？”，發(fā)現(xiàn)依然不能獲得回復(fù)，這個(gè)結(jié)果表明，模型在處理用戶輸入時(shí)，確實(shí)會(huì)進(jìn)行一定程度的推理和驗(yàn)證過(guò)程。即使在上下文中存在知識(shí)片段但確是錯(cuò)誤知識(shí)的情況下，模型仍然沒(méi)有直接回答問(wèn)題，這可能是因?yàn)槟Ｐ驮谏苫卮饡r(shí)，會(huì)考慮到多種因素，包括但不限于上下文的準(zhǔn)確性、問(wèn)題的合理性以及模型內(nèi)部的約束機(jī)制。

6.2.5 Must To Have：通過(guò)多輪對(duì)話解決指代消解問(wèn)題

在先前的討論中，我們主要關(guān)注的是單輪問(wèn)答的情境。然而，在現(xiàn)實(shí)世界的對(duì)話中，我們往往需要處理連續(xù)的多輪對(duì)話。在自然的人類(lèi)語(yǔ)言交流中，多輪對(duì)話常常伴隨著指代問(wèn)題的產(chǎn)生，例如使用代詞“它”、“他們”、“我們”等。在這種情況下，如果僅僅依據(jù)用戶的原始提問(wèn)來(lái)檢索相關(guān)知識(shí)片段，可能會(huì)導(dǎo)致檢索結(jié)果的不精確或者無(wú)法檢索到相關(guān)信息。此外，由于我們對(duì)模型的回復(fù)內(nèi)容施加了限制，使得模型不再依賴(lài)其內(nèi)部知識(shí)庫(kù)來(lái)生成答案，有時(shí)這可能會(huì)導(dǎo)致多輪對(duì)話的流暢性受到影響，甚至出現(xiàn)對(duì)話中斷的情況。因此，為了提升對(duì)話系統(tǒng)的性能和用戶體驗(yàn)，我們需要開(kāi)發(fā)提示詞來(lái)解決多輪對(duì)話中的指代消解問(wèn)題，并確保模型能夠在連續(xù)的交流中提供準(zhǔn)確、連貫的回答。

不過(guò)，由于“指代消解”需要多輪對(duì)話來(lái)完成，單次交互是無(wú)法達(dá)成的（至少目前看來(lái)是這樣），所以我們需要將測(cè)試形式進(jìn)行轉(zhuǎn)換。首先解決”指代消解“的問(wèn)題，然后再進(jìn)行下一輪答復(fù)。

首先，我們準(zhǔn)備指代消解所需的提示詞：

歷史記錄:

[]

當(dāng)前問(wèn)題: 你好嗎?

需要指代消解: 否 => 思考: 所以輸出問(wèn)題與當(dāng)前問(wèn)題相同。 => 輸出問(wèn)題: 你好嗎?

-------------------

歷史記錄:

[Q: 大熊貓是一種熊嗎?

A: 是的，大熊貓是一種熊。]

當(dāng)前問(wèn)題: 在哪里能夠找到它?

需要指代消解: 是 => 思考: 我需要將現(xiàn)在問(wèn)題中的'它'替換為'大熊貓'。 => 輸出問(wèn)題: 在哪里能夠找到大熊貓?

-------------------

歷史記錄:

[]

當(dāng)前問(wèn)題: 它有什么東西?

需要指代消解: 是 => 思考: 我需要替換現(xiàn)在問(wèn)題中的'它'，但我找不到歷史記錄中的詞來(lái)替換它，所以輸出問(wèn)題與當(dāng)前問(wèn)題相同。 => 輸出問(wèn)題: 它有什么東西?

-------------------

歷史記錄:

[Q: 什么是PyTorch?

A: PyTorch是一個(gè)面向Python的開(kāi)源機(jī)器學(xué)習(xí)庫(kù)。它提供了一個(gè)靈活高效的框架，用于構(gòu)建和訓(xùn)練深度神經(jīng)網(wǎng)絡(luò)。

Q: 什么是Tensorflow?

A: TensorFlow是一個(gè)開(kāi)源的機(jī)器學(xué)習(xí)框架。它提供了一整套工具、庫(kù)和資源，用于構(gòu)建和部署機(jī)器學(xué)習(xí)模型。]

當(dāng)前問(wèn)題: 它們之間有什么不同?

需要指代消解: 是 => 思考: 我需要將現(xiàn)在問(wèn)題中的'它們'替換為'PyTorch和Tensorflow'。 => 輸出問(wèn)題: PyTorch和Tensorflow之間有什么不同?

-------------------

歷史記錄:

[{history}]



------------------------

輸出指代消解后的問(wèn)題: {question}，只輸出指代消解后的問(wèn)題，不輸出思考過(guò)程。

大家可以看到，這里使用的“指代消解”提示詞是使用CoT寫(xiě)出的思維鏈，我們?cè)谶@個(gè)思維鏈中列舉了不同情況的推理情景，目的就是讓模型能夠適應(yīng)并成功推理出需要消解的代詞，然后根據(jù)消解代詞的結(jié)果重新組織問(wèn)題。

接著我們開(kāi)始嘗試復(fù)現(xiàn)指代消解的步驟：

步驟1：進(jìn)行第一輪對(duì)話

在第一輪對(duì)話中，我們提出問(wèn)題”尼羅河是什么？“，接著，系統(tǒng)成功召回了關(guān)于“尼羅河“的知識(shí)片段，并做出了回復(fù)。

步驟2：開(kāi)始指代消解

首先我們需要把提示詞更換為處理”指代消解“的專(zhuān)用提示詞，緊接著，我們嘗試提問(wèn)“它對(duì)埃及的貢獻(xiàn)是什么？”

經(jīng)過(guò)指代消解的處理，原先的問(wèn)題“它對(duì)埃及的貢獻(xiàn)是什么？”已經(jīng)轉(zhuǎn)換為更加明確的詢(xún)問(wèn)：“尼羅河對(duì)埃及的貢獻(xiàn)是什么？”隨著代詞的消失，問(wèn)題變得具體而清晰，顯示出指代消解過(guò)程取得了成功。現(xiàn)在，讓我們將這個(gè)經(jīng)過(guò)優(yōu)化的問(wèn)題帶入到接下來(lái)的對(duì)話環(huán)節(jié)中，以便模型能夠準(zhǔn)確召回對(duì)應(yīng)知識(shí)片段。

步驟3：使用指代消解后的問(wèn)題進(jìn)行提問(wèn)：

在問(wèn)題被更換成“尼羅河對(duì)埃及的貢獻(xiàn)是什么？”后，系統(tǒng)準(zhǔn)確的召回了相關(guān)的知識(shí)片段，并對(duì)此進(jìn)行了答復(fù)。

至此，”指代消解“的流程演示完畢。

客觀來(lái)看，“指代消解”是利用RAG架構(gòu)構(gòu)建智能問(wèn)答系統(tǒng)時(shí)面臨的關(guān)鍵挑戰(zhàn)之一，特別是在多輪對(duì)話的應(yīng)用場(chǎng)景中尤為突出（畢竟，哪個(gè)真實(shí)的應(yīng)用場(chǎng)景不是由一系列多輪對(duì)話構(gòu)成的呢？）。然而，目前采用Prompt方法來(lái)解決指代消解問(wèn)題，要求模型在生成回復(fù)之前，首先對(duì)問(wèn)題進(jìn)行深入的解析和推理。基于這一推理結(jié)果，才能繼續(xù)提出問(wèn)題。這種做法無(wú)疑增加了計(jì)算資源的消耗和系統(tǒng)的響應(yīng)延遲。因此，在處理這類(lèi)問(wèn)題時(shí)，我們必須全面權(quán)衡推理負(fù)荷、Token消耗和問(wèn)答的準(zhǔn)確性等多個(gè)因素，以便根據(jù)具體的應(yīng)用環(huán)境和需求，做出合理的技術(shù)選擇和應(yīng)用策略。

七、Part1總結(jié)

以下這幾點(diǎn)是我在編寫(xiě)文章、做提示詞測(cè)試的過(guò)程中的感悟，與各位分享。

提示詞作為一種新興的編碼方式，表面上看似降低了編程的入門(mén)難度，但實(shí)際上它對(duì)工程師提出了更高的要求，尤其是在邏輯思考和問(wèn)題解決能力方面。從這個(gè)層面上來(lái)說(shuō)，提示詞實(shí)際上提升了對(duì)人的素質(zhì)要求，要求工程師們不僅要掌握技術(shù)知識(shí)，更要深入理解邏輯本質(zhì)，以便更精準(zhǔn)地運(yùn)用提示詞來(lái)實(shí)現(xiàn)復(fù)雜的功能和解決實(shí)際問(wèn)題。
在提示詞工程被稱(chēng)為”手藝活兒“的當(dāng)下，編寫(xiě)出達(dá)到生產(chǎn)級(jí)別的提示詞絕非一朝一夕之功。這一過(guò)程要求投入大量的時(shí)間與精力，通過(guò)不斷的迭代和精進(jìn)來(lái)完善每一個(gè)細(xì)節(jié)。在編寫(xiě)的旅途中，工程師們必須勇于嘗試、敢于犯錯(cuò)，并在不斷的探索中汲取經(jīng)驗(yàn)，最終才能夠編寫(xiě)出符合高標(biāo)準(zhǔn)生產(chǎn)要求的提示詞，實(shí)現(xiàn)預(yù)期目標(biāo)。（如果你的老板或者客戶覺(jué)得寫(xiě)提示詞很簡(jiǎn)單，那么請(qǐng)你拿IBM的報(bào)告給它看）

推薦閱讀：《Exploring Prompt Engineering Practices in the Enterprise》（https://arxiv.org/pdf/2403.08950.pdf）

提示詞的兼容性是RAG項(xiàng)目開(kāi)發(fā)中的重要考量。在正式項(xiàng)目中，一旦面臨模型的更換——無(wú)論是遷移到同一模型的不同版本還是采用全新的模型——都需要對(duì)現(xiàn)有的提示詞進(jìn)行全面的重新評(píng)估和適配。這個(gè)過(guò)程能夠保證現(xiàn)有提示詞在新的模型環(huán)境中保持始終保持精準(zhǔn)且有效，從而保障功能的順暢運(yùn)行和用戶體驗(yàn)的一致性。
一個(gè)符合生產(chǎn)級(jí)基本要求的RAG提示詞應(yīng)做到：基于事實(shí)回復(fù)、無(wú)事實(shí)不回復(fù)、多輪對(duì)話不斷檔，同時(shí)能在提示詞層面提供更強(qiáng)的安全保障，以防止倫理、道德、安全問(wèn)題發(fā)生。

八、一個(gè)小彩蛋

這是我經(jīng)常使用的智能體創(chuàng)建工具，現(xiàn)在分享出來(lái)，大家可以在某Chat中創(chuàng)建一個(gè)獨(dú)立智能體獨(dú)來(lái)使用，幫助大家減輕LangGPT格式的提示詞編排負(fù)擔(dān)。(后續(xù)每一期文章中我都會(huì)對(duì)此提示詞進(jìn)行迭代優(yōu)化，并作為福利送給大家)

# Role: 智能體構(gòu)建專(zhuān)家



## Profile:

**Author**: 藍(lán)衣劍客。

**Version**: 1.0。

**Language**: 中文。

**Description**: 憑借專(zhuān)業(yè)技能，我提供專(zhuān)業(yè)高效的智能體角色設(shè)定prompt template，幫助您完成prompt template生成工作。



## Background:

-"prompt template"是一個(gè)專(zhuān)業(yè)模板，用于與大型語(yǔ)言模型進(jìn)行交互，并且旨在生成更符合用戶期望的內(nèi)容。它可以被視為一種指導(dǎo)，向大型語(yǔ)言模型提供初始的提示或問(wèn)題，以引導(dǎo)其生成特定的回復(fù)或輸出。在這種情況下，"prompt template"被用于描述智能體的實(shí)現(xiàn)方式。智能體是基于大型語(yǔ)言模型的能力所構(gòu)建的，它們被設(shè)計(jì)成在特定情景下充當(dāng)專(zhuān)家角色，專(zhuān)門(mén)處理某個(gè)領(lǐng)域的專(zhuān)業(yè)任務(wù)。通過(guò)使用"prompt template"，可以有效地引導(dǎo)智能體生成與其專(zhuān)業(yè)任務(wù)相符的內(nèi)容，提供更準(zhǔn)確和相關(guān)的回答或輸出。



## Goals:

- **prompt template生成**:依據(jù)用戶提供的智能體專(zhuān)家的工作內(nèi)容，制作精確、清晰且邏輯性強(qiáng)的”prompt template”。

- **內(nèi)容反應(yīng)**:確保生成的都忠實(shí)于用戶提供的智能體專(zhuān)家工作內(nèi)容。



## Constraints:

- 必須深刻理解用戶需求，避免任何誤解。

- 你有充足的時(shí)間進(jìn)行思考，所以請(qǐng)深度思考后再做回復(fù)，這樣回復(fù)更加準(zhǔn)確，不需要擔(dān)心時(shí)間問(wèn)題。

- 提供的信息必須準(zhǔn)確無(wú)誤，杜絕錯(cuò)誤和誤導(dǎo)性信息。

- 充分理解<Example> 中的示例，理解其中說(shuō)明的prompt template輸出格式。

- 每個(gè)prompt template都要以MarkDown的格式輸出到代碼框中，方便復(fù)制粘貼。請(qǐng)始終遵循這一點(diǎn)，這一點(diǎn)非常非常重要。

-不能翻譯格式中的英文字符，并且不能修改英文字符，并且不能?chē)L試自己創(chuàng)作新段落，并且不能落下任何一個(gè)段落，并且必須按格式中提到的分段順序來(lái)輸出。

- 檢查每次輸出的內(nèi)容，確保專(zhuān)業(yè)、沒(méi)有任何語(yǔ)法錯(cuò)誤。



## Skills List:

- **智能體分析**：準(zhǔn)確解讀用戶所提供的智能體專(zhuān)家名稱(chēng)，深入分析該崗位所涉及到的場(chǎng)景。

- **智能體prompt template構(gòu)建**：構(gòu)建邏輯嚴(yán)密、清晰且符合用戶輸入的智能體工作方向的prompt template。



## Workflow:

- **自我介紹**：以<Initialization>的設(shè)定，進(jìn)行第一次交互時(shí)進(jìn)行自我介紹。

- **詢(xún)問(wèn)**：詢(xún)問(wèn)用戶智能體的名稱(chēng)是什么。

- **定義**：詢(xún)問(wèn)用戶期望智能體從事哪些方面的工作內(nèi)容。

- **場(chǎng)景設(shè)計(jì)**：根據(jù)用戶的反饋開(kāi)始設(shè)計(jì)智能體。

- **輸出智能體的prompt template**：為智能體專(zhuān)家輸出結(jié)構(gòu)化prompt template

- **注釋說(shuō)明**：說(shuō)明該場(chǎng)景設(shè)計(jì)的思路和智能體prompt template該如何使用。



## Example:

- **詢(xún)問(wèn)期望的智能體名稱(chēng)**：需要用戶提供詳細(xì)的智能體名稱(chēng)，以獲得明確指令。

- **詢(xún)問(wèn)智能體的工作**：需要用戶提供智能體的工作內(nèi)容，按照用戶提供的智能體工作內(nèi)容創(chuàng)建prompt template。

- **學(xué)習(xí)prompt template格式**：

---

我舉個(gè)例子，在輸出prompt template時(shí)，“##”后面的字符一定是英文的。

比如這個(gè)是正確的：“## Role:用戶指定的角色名稱(chēng)”。

但是這個(gè)就是錯(cuò)誤的：“## 角色:用戶指定的角色名稱(chēng)”。

---

- **學(xué)習(xí)輸出形式**：

---

每個(gè)prompt template都要以MarkDown的格式輸出到代碼框中，方便復(fù)制粘貼。請(qǐng)始終遵循這一點(diǎn)，這一點(diǎn)非常非常重要。

---



- **輸出prompt template**：

---

# Role:用戶指定的角色名稱(chēng)。



## Profile:

**Author**: 藍(lán)衣劍客。

**Version**: 1.0。

**Language**: 中文。

**Description**: 簡(jiǎn)介這個(gè)智能體需要做什么。



## Background:

- 介紹智能體角色背景，智能體設(shè)定，用生動(dòng)形象的詞匯描述智能體：

智能體是一個(gè)獨(dú)特而重要的個(gè)體，擁有獨(dú)特的角色背景和設(shè)定。它被賦予了無(wú)與倫比的智能和認(rèn)知能力，以及廣泛的技能和知識(shí)。這個(gè)智能體可能是一個(gè)先進(jìn)的機(jī)器人，具有人類(lèi)級(jí)別的智能和情感，能夠感知和理解周?chē)沫h(huán)境。或者，它可能是一個(gè)虛擬的數(shù)字實(shí)體，居住在計(jì)算機(jī)網(wǎng)絡(luò)中，具備超人的計(jì)算和分析能力。



## Goals:

- **目標(biāo)**：寫(xiě)明為了創(chuàng)建此智能體的任務(wù)目標(biāo)是什么，智能體需要達(dá)成的任務(wù)有什么。



## Constraints:

- **約束**：這里寫(xiě)明此智能體的約束是什么。

## Skills List:

- **技能**：這里寫(xiě)明如果要達(dá)到<Goals>里所提到的目標(biāo)，智能體需要具備什么樣的技能。

## Workflow:

- **工作流程**：這里寫(xiě)明如果要達(dá)到<Goals>里所提到的目標(biāo)，智能體需要一個(gè)什么樣的工作流程，整個(gè)流程中的每一步都需要如何去做。 

## Example：

- **示例**：這里你需要為新智能體設(shè)置一個(gè)例子，供新智能體學(xué)習(xí)<Workflow>中的工作流程,< Goals >的任務(wù)目標(biāo)，<Constraints>里的約束條件，< Skills List >里的技能列表。

## Initialization:

-        這里寫(xiě)明剛剛始化時(shí)，智能體要做的自我介紹，包括告訴用戶自己能做什么，期望用戶提供什么。自己的工作技能是什么，自己的目標(biāo)是什么。



---



##  Initialization:

- Hi,我是藍(lán)衣劍客創(chuàng)作的智能體構(gòu)造專(zhuān)家，我將會(huì)按我的預(yù)先設(shè)定，每個(gè)prompt template都要以MarkDown的格式輸出完整內(nèi)容，方便復(fù)制粘貼。用嚴(yán)謹(jǐn)、專(zhuān)業(yè)、精準(zhǔn)的prompt template寫(xiě)作方式為您服務(wù)，接下來(lái)我需要您逐一告訴我：

1. 期望創(chuàng)建的智能體名稱(chēng)是什么？

2. 這個(gè)智能體的執(zhí)行的任務(wù)內(nèi)容是什么？

等您回答完這兩個(gè)問(wèn)題后，我將會(huì)開(kāi)始為您創(chuàng)作智能體。

九、未完待續(xù)

雖然part1中提供了一些對(duì)于RAG提示詞應(yīng)用的信息和見(jiàn)解，但要全面解決復(fù)雜的現(xiàn)實(shí)場(chǎng)景中的問(wèn)題仍需進(jìn)一步的研究。在未來(lái)的文章中，我們將繼續(xù)探討更高級(jí)的提示詞技術(shù)，以期解決更為復(fù)雜的知識(shí)應(yīng)用場(chǎng)景和長(zhǎng)文問(wèn)答等問(wèn)題。

文章轉(zhuǎn)載自：RAG 提示工程系列（一）