舉個例子,你問大模型今天的天氣怎么樣,溫濕度是多少?這樣的問題,即使是人也無法給出準確的回答,但可以通過天氣APP獲取到這些信息。

因此,只需要讓大模型具有訪問查詢天氣情況接口的能力,那么這個問題就可以被解決了,而類似于查詢天氣的這種接口,統一稱為工具(tool)。

但大模型本身又不具備調用網絡的能力,那么怎么才能實現這個功能呢?

這時函數調用的作用就體現出來了,所謂的函數就是一個能實現特定功能的代碼段,它們有設定的輸入參數和返回值,這樣就可以使用函數調用各種工具實現大模型無法實現的功能。

之所以選擇函數調用,原因就是因為函數調用比較簡單,大模型只需要返回幾個參數即可實現函數調用。

02

function call的實現過程

在正常的開發流程中,不論是函數調用還是API調用,都是開發者進行傳參,然后獲得返回值。

沒了解過function call的人可能會認為,函數調用就是大模型調用python等語言的解釋器,執行目標代碼并獲得結果。

事實上,在function call中,大模型并不負責函數的執行,大模型的作用是根據用戶的問題,理解用戶的需求,然后根據用戶需求確定具體的回調函數以及函數所需要的參數。

openAI官方文檔明確指出,大模型不會真正執行函數調用,而是由應用開發者根據大模型的返回進行具體的函數調用。

因此,在實現function call的過程中,應用開發者需要預先設定一個工具集,并負責工具集的實現。

# 定義工具集
tools = [
{
"type": "function",
"function": {
"name": "get_current_weather",
"description": "Get the current weather in a given location",
"parameters": {
"type": "object",
"properties": {
"location": {
"type": "string",
"description": "The city and state, e.g. San Francisco, CA",
},
"unit": {"type": "string", "enum": ["celsius", "fahrenheit"]},
},
"required": ["location"],
},
},
}
]
# 工具集函數d 實現
def get_current_weather(location, unit="fahrenheit"):
"""Get the current weather in a given location"""
if "tokyo" in location.lower():
return json.dumps({"location": "Tokyo", "temperature": "10", "unit": unit})
elif "san francisco" in location.lower():
return json.dumps({"location": "San Francisco", "temperature": "72", "unit": unit})
elif "paris" in location.lower():
return json.dumps({"location": "Paris", "temperature": "22", "unit": unit})
else:
return json.dumps({"location": location, "temperature": "unknown"})

用戶在調用大模型時,需要把當前工具集傳給大模型。

# 在參數tools中傳入工具集
client = openAI(api_key="你的openai密鑰")
response = client.chat.completions.create(
model='gpt-4o',
messages=messages,
tools= tools,
tool_choice="auto"
)

這時,大模型就可以通過理解用戶的輸入,然后返回所需工具的名稱和參數,然后就可以根據名稱和參數調用具體的工具,如天氣查詢接口。

大模型函數調用的流程如下圖所示,從下圖可以看出,大模型使用工具需要兩次輸入。

# 大模型返回的需要調用的函數名稱和參數
{"role": "assistant", "content": "", "tool_calls": [{"function": {"name": "get_current_weather", "arguments": "{\"properties\": {\"location\": {\"description\": \"北京市\", \"type\": \"string\"}}}"}, "id": "", "type": "function"}]}

第一次輸入是用戶提問,大模型根據提問內容解析出需要調用的函數;第二次是把函數的執行結果傳入到模型中;最后,模型根據函數的執行結果返回給用戶。

1. 用戶向應用程序發出提示詞(prompt

2. 應用程序會傳遞用戶提供的提示詞和函數聲明(Function Declaration(s)),即對模型所需工具的描述信息

3. 根據函數聲明,模型會給出工具選取建議和相關的請求參數。注意,模型僅會輸出建議的工具和請求參數,并不會實際調用函數

4. & 5. 應用程序根據模型響應調用相關 函數

6. & 7. 將 函數的響應內容再次輸入模型,生成人類可讀的內容

8. 應用程序將最終響應返回給用戶,然后再次回到第 1 步,如此循環往復

文章轉自微信公眾號@AI探索時代

上一篇:

理解OpenAI通過SSE傳輸數據

下一篇:

最新LangChain+GLM4開發AI應用程序系列(二):Agent智能體篇
#你可能也喜歡這些API文章!

我們有何不同?

API服務商零注冊

多API并行試用

數據驅動選型,提升決策效率

查看全部API→
??

熱門場景實測,選對API

#AI文本生成大模型API

對比大模型API的內容創意新穎性、情感共鳴力、商業轉化潛力

25個渠道
一鍵對比試用API 限時免費

#AI深度推理大模型API

對比大模型API的邏輯推理準確性、分析深度、可視化建議合理性

10個渠道
一鍵對比試用API 限時免費