舉個例子,你問大模型今天的天氣怎么樣,溫濕度是多少?這樣的問題,即使是人也無法給出準確的回答,但可以通過天氣APP獲取到這些信息。

因此,只需要讓大模型具有訪問查詢天氣情況接口的能力,那么這個問題就可以被解決了,而類似于查詢天氣的這種接口,統(tǒng)一稱為工具(tool)。

但大模型本身又不具備調用網絡的能力,那么怎么才能實現(xiàn)這個功能呢?

這時函數(shù)調用的作用就體現(xiàn)出來了,所謂的函數(shù)就是一個能實現(xiàn)特定功能的代碼段,它們有設定的輸入參數(shù)和返回值,這樣就可以使用函數(shù)調用各種工具實現(xiàn)大模型無法實現(xiàn)的功能。

之所以選擇函數(shù)調用,原因就是因為函數(shù)調用比較簡單,大模型只需要返回幾個參數(shù)即可實現(xiàn)函數(shù)調用。

02

function call的實現(xiàn)過程

在正常的開發(fā)流程中,不論是函數(shù)調用還是API調用,都是開發(fā)者進行傳參,然后獲得返回值。

沒了解過function call的人可能會認為,函數(shù)調用就是大模型調用python等語言的解釋器,執(zhí)行目標代碼并獲得結果。

事實上,在function call中,大模型并不負責函數(shù)的執(zhí)行,大模型的作用是根據用戶的問題,理解用戶的需求,然后根據用戶需求確定具體的回調函數(shù)以及函數(shù)所需要的參數(shù)。

openAI官方文檔明確指出,大模型不會真正執(zhí)行函數(shù)調用,而是由應用開發(fā)者根據大模型的返回進行具體的函數(shù)調用。

因此,在實現(xiàn)function call的過程中,應用開發(fā)者需要預先設定一個工具集,并負責工具集的實現(xiàn)。

# 定義工具集
tools = [
{
"type": "function",
"function": {
"name": "get_current_weather",
"description": "Get the current weather in a given location",
"parameters": {
"type": "object",
"properties": {
"location": {
"type": "string",
"description": "The city and state, e.g. San Francisco, CA",
},
"unit": {"type": "string", "enum": ["celsius", "fahrenheit"]},
},
"required": ["location"],
},
},
}
]
# 工具集函數(shù)d 實現(xiàn)
def get_current_weather(location, unit="fahrenheit"):
"""Get the current weather in a given location"""
if "tokyo" in location.lower():
return json.dumps({"location": "Tokyo", "temperature": "10", "unit": unit})
elif "san francisco" in location.lower():
return json.dumps({"location": "San Francisco", "temperature": "72", "unit": unit})
elif "paris" in location.lower():
return json.dumps({"location": "Paris", "temperature": "22", "unit": unit})
else:
return json.dumps({"location": location, "temperature": "unknown"})

用戶在調用大模型時,需要把當前工具集傳給大模型。

# 在參數(shù)tools中傳入工具集
client = openAI(api_key="你的openai密鑰")
response = client.chat.completions.create(
model='gpt-4o',
messages=messages,
tools= tools,
tool_choice="auto"
)

這時,大模型就可以通過理解用戶的輸入,然后返回所需工具的名稱和參數(shù),然后就可以根據名稱和參數(shù)調用具體的工具,如天氣查詢接口。

大模型函數(shù)調用的流程如下圖所示,從下圖可以看出,大模型使用工具需要兩次輸入。

# 大模型返回的需要調用的函數(shù)名稱和參數(shù)
{"role": "assistant", "content": "", "tool_calls": [{"function": {"name": "get_current_weather", "arguments": "{\"properties\": {\"location\": {\"description\": \"北京市\(zhòng)", \"type\": \"string\"}}}"}, "id": "", "type": "function"}]}

第一次輸入是用戶提問,大模型根據提問內容解析出需要調用的函數(shù);第二次是把函數(shù)的執(zhí)行結果傳入到模型中;最后,模型根據函數(shù)的執(zhí)行結果返回給用戶。

1. 用戶向應用程序發(fā)出提示詞(prompt

2. 應用程序會傳遞用戶提供的提示詞和函數(shù)聲明(Function Declaration(s)),即對模型所需工具的描述信息

3. 根據函數(shù)聲明,模型會給出工具選取建議和相關的請求參數(shù)。注意,模型僅會輸出建議的工具和請求參數(shù),并不會實際調用函數(shù)

4. & 5. 應用程序根據模型響應調用相關 函數(shù)

6. & 7. 將 函數(shù)的響應內容再次輸入模型,生成人類可讀的內容

8. 應用程序將最終響應返回給用戶,然后再次回到第 1 步,如此循環(huán)往復

文章轉自微信公眾號@AI探索時代

上一篇:

理解OpenAI通過SSE傳輸數(shù)據

下一篇:

最新LangChain+GLM4開發(fā)AI應用程序系列(二):Agent智能體篇
#你可能也喜歡這些API文章!

我們有何不同?

API服務商零注冊

多API并行試用

數(shù)據驅動選型,提升決策效率

查看全部API→
??

熱門場景實測,選對API

#AI文本生成大模型API

對比大模型API的內容創(chuàng)意新穎性、情感共鳴力、商業(yè)轉化潛力

25個渠道
一鍵對比試用API 限時免費

#AI深度推理大模型API

對比大模型API的邏輯推理準確性、分析深度、可視化建議合理性

10個渠道
一鍵對比試用API 限時免費