具體來說,從當前的 AI Agent 主要實現方式來看,「自主規劃」體現在開發者打造 Agent 的過程與傳統軟件工程不同:傳統軟件工程需要通過機器可執行的具體算法用編程語言實現,然而在打造 Agent 的過程中,開發者不再需要給出具體算法,不需要用計算機語言,甚至偽代碼(pseudo code)都不用,只需要用自然語言定義任務(輸入和輸出),就可以開啟 Agent 的自主規劃來執行任務,打造agent的初版。

而「環境交互」能力則體現在,從 AI Agent 初版到能上架平臺的“產品”之間,Agent 在樣本數據輸入的驅動下,會有兩種輸出結果:

一是錯誤信息,這表明Agent自主規劃的路徑有問題,類似傳統編程的句法錯誤;

二是輸出結果不如人意,這就如同傳統編程中的邏輯錯,這時候開發者可以添加具體反饋,說明樣本輸入所對應的期望輸出是什么。

這兩類信息都可以在開發平臺上直接回饋給Agent;作為Agent與環境的交互,Agent 會對環境反饋的錯誤進行“反思”,在下一輪迭代中試圖修正;如此循環,一個能用的Agent就制作完成,可以作為產品上架平臺。這是 Agent 與環境交互的“內迭代”。

而Agent發布后,在用戶實際使用過程中的環境反饋,則構成了Agent與環境交互的“外迭代”。“外迭代”與“內迭代”一樣,原則上可以直接饋送給 Agent,讓 Agent 自我提升,與用戶偏好對齊,迭代新的上線版本。外迭代的流程化標志著環境數據飛輪的建立。

從技術的進化路徑來看,我們見證了 OpenAI 從 Plugins 插件功能的開放到 GPTs 平臺的生態建設,以及微軟從 GitHub Copilot 到 Microsoft 365 Copilot 的跨越。業界傳統 Pipeline 的過程性應用開發,開始借助大模型賦能的新平臺向 Agent 這種端到端的開發范式演進。

從產品形態的進化路徑來看,從單一功能的 coding 助手(如 GitHub Co-pilot),發展到 AutoGPT 這樣的 Agent 平臺,再到 MetaGPT、AutoGen 等多Agent框架的發布,還有OpenAI的Agent開發框架Assistant API的發布,Agent的開發工具和平臺越來越簡便,Agent的能力也隨之增強。

而在國內的眾多平臺,尤其是協同辦公平臺中,我們發現在技術路徑與產品形態的進化上,釘釘與大模型及其AI Agent  這一年的發展趨勢幾乎步步吻合,且將 AI Agent 技術與企業實際場景相結合,以最快的速度建立了AI助理的開發平臺和生態。

這一年中,釘釘在業內率先用大模型將自身產品改造了一番,20條產品線都已經被AI化,智能問答、問數在企業獲得了較好的應用;再者,釘釘背靠的自家大模型通義千問也在快速演進,比如長文本、多模態能力,為 Agent 的進化夯實了模型基礎;同時,依托釘釘本身作為協同平臺的優勢,以及工作流、AI PaaS等大量平臺工程化的能力,其 Agent 逐步實現了與業務流程和數據的打通。

釘釘對 Agent 技術的探索一直圍繞企業實際需求展開,其差異化優勢在于它通過千行百業的辦公需求(企業的“最大公約數”)吸引了大量的 ToB 用戶,并在其平臺的統一框架下積累了巨量的應用和數據。前幾天,釘釘上線了自己的「Agent Store」(名為「AI助理市場」),已經擁有超過200個AI助理。

這種客戶粘性以及巨量用戶數據的積淀,讓釘釘在 Agent 的落地應用上處于天然優勢。

03.

做AI Agent ,誰更有勝率?為什么海量的用戶是做 AI Agent 的底氣?

檢驗Agent運轉是否有效,一個很重要的指標就在于其「信息檢索」的能力,這也是RAG技術備受重視的原因,它讓Agent能夠利用外部知識和時效信息,來為用戶提供更加精準、更有相關性的回答和服務。

而這需要Agent生長在一個有海量數據的平臺里,最好還要有足夠多的插件和API工具方便Agent調用,最大化Agent的檢索和理解能力,以提升行動能力。

也就是說,用戶數據量幾乎決定了「產品上限」。

而這正是釘釘們擁有巨大優勢的基石——基于強大的生態和用戶數據,從而讓產品有更多優化的空間。

在釘釘入局AI一年以來,已經有220萬家企業啟用了釘釘AI,覆蓋K12、制造、零售、地產、服務業、互聯網等眾多行業。這些都為釘釘AI平臺積累了豐富的數據,釘釘的「AI助理市場」中有從不同場景歸納出來的“模版”,用戶可以復制過來做新的場景的起點,這讓生長于釘釘平臺的Agent「通用性」更強。

做 AI Agent 的第二個要素是大模型,作為產品的 AI Agent 離不開大模型的賦能,因此「產模結合」具有先天優勢。

前文講到,Agent是一種端到端的大模型產品開發范式。傳統AI產品一般采用過程性的管式(pipeline)系統架構,模塊層層依賴、串聯,Input 與 Output 兩端之間有很多中間結果,模塊化的鏈路很長;而理想的大模型產品是端到端的,產品的迭代提升可以隨著流程化的回流數據自動通過端到端訓練來增強。

端到端的開發要求對很多「產模分離」的公司構成了巨大的挑戰,而少數「產模結合」的公司則為端到端訓練提供了可能性:

一方面,產品源源不斷地收集經同意的用戶反饋“埋點”數據,反哺一體化大模型的用戶對齊訓練,模型的數據質量會隨之提升;

另一方面,不斷迭代的模型反哺產品體驗的優化,對齊用戶期望的產品能吸引更大的用戶群,帶來更多的數據回流。以此構筑的數據壁壘和用戶粘性,才不至于被其他通用大模型的升級換代而碾壓。

而釘釘,本身就是一個真正的「產模結合」公司。有自家大模型,做的是自己的 Agent 產品。
「產模結合」對AI公司非常重要。我們在《為什么「產模結合」是更好的AI公司模式》中提到,擁有產品和模型的公司更容易形成「數據飛輪」,增強核心競爭力。

產品對模型起到關鍵的「定向」或「燈塔」作用:一是產品需求可指導產品優化方向;二是產品有助于檢驗模型的實際表現。

對釘釘來說,基于海量數據的「AI助理市場」,就是那柱指示燈塔,使其模型的訓練目標更加聚焦。

做好AI Agent 的第三個因素是需要平臺的工程化能力。

釘釘上線「AI助理市場」時,其 Agent的能力已有了大跨步的升級。比如在行動系統方面,AI助理「擬人操作」能力大幅增強,AI助理在觀看主人的操作路徑后,即可自動化進行頁面操作,提升高頻業務行為的操作效率,比如一句話讓釘釘AI助理在應用中自動錄入客戶信息、提交維修工單,也支持跳轉聯動飛豬等外部的網頁應用,自主完成訂機票、訂酒店。

再比如工作流,為讓AI助理可以處理更復雜的任務,釘釘在助理的創建過程中加入了工作流。用戶可對任務進行拆解,通過編排執行動作后讓AI助理替自己來完成,使得任務的完成結果更準確,更可控。擬人操作、工作流、連接外部API和系統,都屬于Agent的進階玩法,進一步擴展其行動能力。

作為協同辦公平臺的「通用性」超強大模型的「易用性」和大量工程化的「確定性」,這些都是釘釘做AI助理更有優勢的底氣。

04.

垂直縱深,or橫向發展?基于AI大模型,可以衍生出的產品形態有開放MaaS平臺、以AI Infra為代表的中間層產品等。且在領域藍海中,也有垂直縱深發展的一支。那么,為什么釘釘選擇主推Agent生態,要做一個橫向覆蓋各行各業的Agent市場呢?

一個洞察或許可以回答這個問題:從長遠來看,垂直解決方案獲勝的方法之一是橫向發展。

深潛于垂直領域仍是一片藍海市場,最終可能被兩大江山來瓜分。一種是橫向的切入,另一種是縱向的深入——基于通用大模型,做行業大模型,然后做行業場景的Agent。

很難說后者就一定會被前者碾壓,而選擇橫向切入的前者是很難專門去為每一個垂直領域去做行業大模型的,它通常只能用場景數據臨時加持,表現在 Finetune 和 In-context-learning 上,而不大能做基礎模型的改變。

最近,企業家和平臺經濟學家Sangeet Paul Choudary在博客中提出了一個觀點,他認為,Agent 創造了一個重新整合場景的可能性,它們使垂直領域的AI玩家能夠通過跨多個工作流程進行協調來實現「水平」發展,這將重塑B2B價值鏈。

同樣是拿SaaS作類比,之前垂類SaaS的崛起遵循的是兩個邏輯:

一是抓住核心場景實現快速發展;二是圍繞核心場景做場景延伸。

比如,Square以支付SaaS為起點,后來逐漸擴展到To B和To C的雙生態系統,擴展出了開發者、虛擬終端、銷售、電子商務、客戶管理、發票、股票投資、分期付款、虛擬貨幣等不同的產品線,覆蓋餐飲、零售、金融、電商等各個行業,成為了一個綜合性的SaaS解決方案提供商。

再比如,Toast從為餐廳提供POS機的單點解決方案,擴展到了一個包含軟件(餐廳管理、渠道、訂購、配送交付、薪酬管理、營銷、掃碼訂購)、硬件(固定式終端、手持式終端、非接觸式終端)和配套服務(售后、小額貸款)等的綜合性餐飲SaaS平臺。

可以看出,Square和Toast這類SaaS巨頭都遵循了從垂直到水平擴張的發展策略。Sangeet認為,大多數對現狀的“破壞”(可以理解為創新)都是通過深挖細分場景發生的,但大多數風險投資回報都是通過“整合”實現的。

分拆并不能獲取可持續的價值,比如很多VC確實會在一開始關注細分場景的創新者,但是最后大部分利益都被做生態的“整合者”拿走了。

為了大規模獲取價值,軟件企業需要持續做場景延伸——最終,所有垂直游戲都尋求橫向發展

這一道理或許同樣適用于Agent。盡管Agent具備很好的感知、推理和行動的能力,將其應用于垂直領域可以快速、有效地解決痛點,但這并不能構成護城河,反而真正的護城河在于底層數據的打通之后,Agent之間的互動和配合,也就是Agent跨API重新整合工作流,最終帶動整個系統的提質增效。

而AI Agent Store,也就是AI助理市場,正是這種「整合」和「大一統」的體現,這也是釘釘推出AI助理背后的戰略布局——釘釘要用建立在自己“Hub”上的AI助理市場變革整個To B生態,基于原有的行業和數據積累,實現To B領域最大程度的提質增效。

這一年來,從各個產品線的智能化改造到將AI PaaS開放給生態伙伴和客戶,從AI Copilot到AI Agent、再到AI Agent Store,釘釘一步一步趟出了AI規模化落地的一種形態。在目前各行各業都急于尋找大模型落地場景的當下,釘釘提供了一個AI應用落地的樣板。

我們認為,Agent在To B領域的應用,其實是將AI應用于加速企業數字化進程的體現。Agent的能力加持,解決的最核心問題是「降本增效」,這種特性也決定了以釘釘為代表的AI助理能在To B領域的藍海中具有更大的規模化應用推廣的空間

隨著AI Agent自主性的進一步加強,Agents 會發展成為更加專業化的代理,平替多數專業工作和技能。從趨勢上看,大模型 Agents 取代人類的 90% 的專業工作并非遙不可及,而剩下的10%,也會有CoPilot來加持人類專業人士。

在更遠的未來,Agents 有可能進化成為「全能智能體」,完全取代人類工作,并與更多的硬件產品結合(不僅限于具身智能和人形機器人)。彼時的人類文明與AI Agents 會是怎樣的關系呢?

一切正在從當下這場To B的Agent必爭之地中起步。

而誰,將最先成為這場科技浪潮下的最大受益者?

原文轉自 微信公眾號@飛哥說AI,作者高佳,王藝

上一篇:

AI Agent架構概況:關于推理、規劃和工具調用

下一篇:

探索API主導的最佳AI創業項目商業模式
#你可能也喜歡這些API文章!

我們有何不同?

API服務商零注冊

多API并行試用

數據驅動選型,提升決策效率

查看全部API→
??

熱門場景實測,選對API

#AI文本生成大模型API

對比大模型API的內容創意新穎性、情感共鳴力、商業轉化潛力

25個渠道
一鍵對比試用API 限時免費

#AI深度推理大模型API

對比大模型API的邏輯推理準確性、分析深度、可視化建議合理性

10個渠道
一鍵對比試用API 限時免費