
API經濟 – 什么是API經濟?
規劃組件負責對未來行動的決策和計劃制定,在執行復雜任務時將其分解為子目標,分步解決,并根據外界的反饋進行反思和優化。
工具組件負責調用外部工具來獲取額外的信息或執行能力。GPT4的插件生態與此類似,但這需要用戶根據需求自己選擇相應的插件,而AI Agent可以自動調用工具使用。
那AI Agent 和GPTs相比到底有哪些區別呢?
OpenAI 發布的GPTs算是 AI Agent 初級形態產品。但目前GPTs是基于prompt(提示詞)實現的,針對某個單項任務,只有當你輸入明確有效的prompt時,才有可能得到想要的結果。
而 AI Agent 就如同《星際穿越》里的塔斯、《鋼鐵俠》里的賈維斯一樣,可以根據你提出的需求,自主思考并決策,將目標任務拆解為多個子任務,然后利用外部工具一步步執行,直到達成目標。
AI Agent和大模型的區別在于擁有長期記憶,可以感知世界、協同處理任務,會解決問題并做出決策。
舉一個例子,來自斯坦福大學以及谷歌的人工智能研究團隊創造了斯坦福維爾虛擬村莊,里面的村民是25個不同的AI Agent,他們通過訓練具備了一定的社交技能并擁有各自的性格和社會角色。
在小鎮的生活中他們會記住每天發生的事,并基于新的記憶進入新的一天。而且隨著互動的增加建立了復雜的關系,形成各類群體,并參與各種游戲和活動,甚至自主策劃了一場情人節派對,表現出了令人驚訝的自主性和智能性。
再舉一個生活中的例子,當你需要做年終匯報PPT時,AI Agengt自動將任務分為幾步,并調用其他工具搜集資料、制作圖表、生成內容,甚至協同其他Agengt工作,最終完成PPT。而你使用GPTs則需要自己使用各類插件,每一步都要輸入相應的提示詞,并且進行反復調試才可能得到想要的結果。
那么目前除了上面提到的斯坦福維爾虛擬村莊,還有其他已經開發出來的AI Agent嗎?
事實上,國外已經存在很多AI Agent架構與產品,例如:AutoGPT、Generative Agent、GPT-Engineer、BabyAGI、MetaGPT、GPT Researcher,這些搭載了大型語言模型能力的Agent不僅可以生成內容,還可以直接解決各種場景中的各種問題,涉及零售、房地產、旅游、客戶服務、人力資源、金融、制造業等多個領域。
AI Agent開源性項目的典型代表之一是AutoGPT,它相當于一個完整的工具包,可以為各種項目構建和運行自定義AI Agent。該工具使用OpenAI的GPT-4和GPT-3.5大語言模型(LLM),允許為各種個人和商業項目構建Agent。
AI Agent閉源性項目包括:使用個人知識庫的金融人工智能代理平臺,“開發人員虛擬實習生”BitBuilder,人工智能驅動的軟件開發商GitHub Copilot X等。
美國大語言模型明星創業公司Inflection AI也準備加入其中。據透露其正在開發一款私人助理,可以充當導師,以及處理在旅行過程中的行程預定、航班積分、酒店預定等任務。去年6月,Inflection AI的估值就達到40億美元,累計融資額15.25億美元,在基礎大模型公司中僅次于OpenAI。
亞馬遜云科技也宣布了Amazon Bedrock Agents新功能,它可以把開發、部署和管理多個Agent的能力打包集成在一起,開發者只需要幾次點擊,就可以構建Agent應用。
而在國內,釘釘總裁在采訪時稱釘釘計劃在4月份推出AI Agent Store,目標是成為中國最活躍的AI Agent孵化、分發和交易平臺,三年內產生1000萬個AI助理。聯想集團副總裁對媒體表示,聯想個人Agent將在不久后與用戶見面。
但是目前的AI Agent還未能達到理想效果,其發展仍然面臨一些困境,一方面它的底層技術大模型還不夠完善,復雜推理能力有待提高。
另一方面外部生態融合度不高,比如我們無法直接使用GPTs直接操作SAP或金蝶等ERP系統,目前AI Agent的第三方API基本以搜索和文件讀取功能為主,很難做到比較完整的跨應用生態。
不過AI Agent是當前通往AGI的主要探索方向,它是釋放大模型潛能的關鍵。
隨著的研究發展,AI Agent與人的合作將逐漸加深,人機協作的模式逐漸從人類完成絕大部分工作的嵌入(Embedding)模式、人類和AI協作工作的副駕駛(Copilot)模式,逐漸過渡到AI完成絕大部分工作的智能體(Agent)模式。
AI Agent可以讓大模型從“超級大腦”進化為人類的“全能助手”。 比爾·蓋茨預測 在未來的5年內,AI Agent將得到廣泛應用,每個用戶都將擁有一個專 屬AI Agent 。在人機融合加深的趨勢下,每個普通個體都有可能成為?超級個體?。
文章轉自:網梯科技