
ChatGPT生態系統的安全漏洞導致第三方網站賬戶和敏感數據泄露
在當前,我們仍處于手工制作 Agents 的時代。對開發人員來說,短期內最有效的方式是構建一個基礎設施,滿足開發人員手工制作 Agents 網絡的需求。隨著時間推移,前沿模型將引導更多的工作流程,開發人員可以專注于產品和數據。
有人說,在模型成熟之前,構建應用仿佛在流沙上搭建城堡,而這些基礎設施可能為應用或代理創建者提供了一層緩沖帶,用于靈活適配并保持底層基礎設施的相對穩定和持續迭代。
整體來說,目前 AI Agent 技術棧分為平臺、記憶、規劃與編排、執行和應用 5 個板塊,我們將通過后文逐一介紹。
開發框架是用于構建、部署和管理 agent 綜合平臺。提供模塊化的組件、集成接口和工作流設計,簡化了開發者創建復雜AI應用的過程。支持數據處理、任務調度、上下文管理等功能,幫助實現高效、安全和可擴展的 AI 解決方案。
LangChain 是一個圍繞 LLM 構建的框架,適用于構建聊天機器人、生成式問答( GQA ) 、摘要等應用。
優勢:多語言支持、模塊化設計、豐富的組件和集成結構、完善的生態系統;
劣勢:學習曲線陡峭、依賴外部 AI 服務和 API,可能增加集成和維護成本;
適合:多語言支持和模塊化設計的應用開發;
LlamaIndex 前身為 GPT-Index,是一個創新的數據框架,旨在簡化外部知識庫和大型語言模型的集成,包括各種文件格式,例如 PDF 和 PowerPoint,以及 Notion 和 Slack 等應用程序,甚至 Postgres 和 MongoDB 等數據庫。
優勢:數據檢索方面深度優化、支持多種數據結構;
劣勢:功能單一、社區和資源支持相對較少;
適合:數據索引和檢索優化場景;
Semantic Kernel 是一個集成了 OpenAI、Azure OpenAI、Huggingface的SDK,特別之處在于它能夠自動與 AI 協調插件,借助 Semantic Kernel 規劃器,實現用戶獨特目標的計劃。
優勢:企業級支持、強大的自動化和擴展性,通過插件和計劃生成器執行計劃;
劣勢:初始設置復雜、依賴微軟生態;
適合:企業級應用,需高度可擴展性和穩定性的場景;
Griptape 是一個模塊化 Python 框架,用于構建 AI 驅動的應用程序,包含結構、記憶、任務、工具等多個模塊。
優勢:結構化工作流確保操作的可預測性和可靠性、模塊化設計、安全和性能優化好;
劣勢:初始學習曲線較陡、社區和資源支持較少;
適合:構建復雜 AI 工作流和代理,注重可預測性、安全性和性能的場景;
Agent Hosting 是指在服務器或云基礎設施上部署和運行 AI Agent。托管這些代理需要提供所需的計算資源、安全性和拓展性,以及能夠高效可靠的運行。
Ollama,是這個方向最受關注的項目之一。提供了一整套用于下載、運行和管理 LLMs 的工具和服務,用戶可以在本地設備上高效部署和操作 agent。適合需要快速部署和管理 AI 服務的中小型企業和獨立開發者。
LangServe,將 AI 鏈(模型和工作流)作為 REST API 進行部署,簡化了將復雜 AI 模型集成到生成環境中的過程,提供穩定可拓展的 API 接口。適用于需要將 AI 功能通過 API 提供服務的企業和應用。
E2B,開源的安全云環境,專門為 AI 應用和 AI Agent 提供運行時環境。它通過提供隔離的沙箱環境,使 AI 代理和應用能夠在云中安全地執行代碼。適合用于構建和部署需要安全運行環境的 AI 代理和應用,特別是在代碼執行和數據處理方面。
用于評估 AI Agent 性能和質量的工具。通常通過 Agent 響應的準確性、檢索數據與問題的相關性、響應的性能、安全性和用戶反饋等方式來進行評估。
AgentOps 和 BrainTrust強調全生命周期的代理管理和評估,注重自動化和安全性。
Context專注于對話系統的評估,提升用戶體驗和對話質量。
LangSmith 和 LangFuse ,提供了全面的評估和調試工具,適用于需要詳細追蹤和分析 LLM 應用的團隊。
WhyLabs強調實時監控和異常檢測,適用于需要確保模型在生產環境中穩定運行的場景。
Developer Tools
Developer Tools 提供了多樣化的解決方案,幫助開發者高效地創建、管理和優化 AI Agent。無論是全面自動化的開發助手(Morph)、分步編程和調試工具(FlowPlay AI),還是支持自然語言編程的創新 IDE(Wordware),這些工具都為不同需求和場景提供了有力支持。
指根據用戶的歷史行為、偏好和特定需求,動態調整和定制 AI 代理的響應和功能。這有助于提升用戶體驗,使得 AI 代理更具相關性和響應性。
WhyHowAI:提供個性化推薦和響應優化。借助 WhyHow,開發人員可以自動創建知識圖譜并將其與現有工作流程集成,構建有效的 RAG 解決方案。
Cognee:通過分析用戶交互數據,提供個性化服務。
Graphlit:利用用戶數據進行個性化推薦。
LangMem:專注于個性化記憶功能,使 AI 代理能夠記住用戶的偏好和歷史交互。
MemGPT:結合 GPT 模型進行個性化響應生成。MemGPT 代表 Memory-GPT,是一種旨在通過引入更先進的內存管理方案來提高大型語言模型 (LLM) 性能的系統,有助于克服固定上下文窗口帶來的挑戰。
存儲是指為 Agent 提供高效、可靠的數據存儲解決方案。這些存儲系統需要能夠處理大量的數據,并支持快速的讀寫操作,以確保 AI 模型的高效運行。
Pinecone:專注于高性能的向量數據庫,支持快速的數據檢索。
Chroma:提供高效的數據存儲解決方案,開源的向量數據庫,專為AI和嵌入式應用設計。
Weaviate:開源的向量數據庫,支持基于內容的檢索和存儲。
MongoDB:流行的 NoSQL 數據庫,提供靈活的存儲和檢索功能。
指 AI Agent 能夠理解和利用對話或任務中的上下文信息,以提供更加準確和相關的響應。這一層次的技術確保了 Agent 能夠保持連貫性,并理解更復雜的用戶需求。
Unstructure:開源項目,致力于提供強大的上下文管理功能,使 AI 代理能夠理解和利用對話或任務中的上下文信息,從而提供更加連貫和智能的響應。
數據在系統長期保存和可用性,這包括將重要數據(如用戶交互、任務狀態和執行日志)安全地保存到數據庫或其他存儲介質,以便在需要時能夠可靠地檢索和使用。
1)、Inngest:事件驅動的持久化工作流引擎,支持在任何平臺上運行。提供 SDK 在現有代碼庫中編寫持久函數和工作流,可通過 HTTP 端點進行調用,無需額外的基礎設施管理。該項目獲得了 a16z 領投的 610 萬美金。
2)、Hatchet:一個端到端的任務編排平臺,支持分布式、容錯任務隊列,旨在解決并發、公平性和速率限制等擴展問題,支持復雜任務編排和可視化 DAG(有向無環圖)工作流設計,以確保工作流的組織和可預測性。YC W24 布局了該項目,其愿景是在后臺使用異步任務運行緩慢的 OpenAI 請求,將復雜的任務串聯到工作流中,并設置重試和超時以從故障中恢復。
3)、Temporal:一個開源的工作流和編排系統,支持任務的持久化存儲,確保任務的可靠執行和恢復能力。
4)、Trigger.dev:通過事件驅動的方式,提供任務和工作流的持久化管理,幫助開發者更好地管理復雜任務。
編排是指協調和管理不同 AI 組件和服務,以確保它們在預定的流程中高效地協同工作。
1)、DSPy:通過模塊化和聲明式的方法,DSPy 的核心是引入一種結構化的、以編程為中心的方法,取代傳統的提示工程,允許用戶以更清晰和高效的方式構建和優化復雜的 AI 系統。該架構由斯坦福的研究人員開發,目前在 Github 獲得 1.4 萬顆星。
2)、AutoGen:微軟開發的開源框架,自動生成和管理 AI 模型及其相關的工作流,簡化了模型開發和部署的過程。AutoGen 提供多代理對話框架作為高級抽象。
3)、Sema4.ai:提供智能編排解決方案,用于優化和自動化機器學習和 AI 項目中的各個步驟。
4)、LangGraph:LangChain 框架的擴展,旨在通過圖形化的方法創建多代理工作流。能夠處理有狀態、循環和多角色的應用,適合構建需要多個代理協同工作的復雜 AI 系統。
5)、Griptape:提供靈活的編排框架,使開發者能夠輕松定義、管理和執行復雜的 AI 工作流。
6)、CrewAI:一個多代理系統平臺,旨在通過簡單有效的方式實現復雜工作流的自動化。
7)、Fixpoint:提供可靠的編排工具,確保 AI 和數據工作流的高效運行和管理,適用于多種 AI 和數據密集型應用。
Action 即執行層,主要涵蓋了各種用于執行特定任務和操作的工具和服務。這一層專注于提供執行動作、工具使用、授權管理以及 UI 自動化等方面的支持,使 AI agent 能夠高效、準確地完成指定任務。
AgentLabs 是一個開源的、用于搭建 Chat-based 應用的前端服務平臺。可以在分鐘之內快速創建豐富的聊天助手應用,提供 Node 和 Python SDK。
LLM 具備與外部工具或 API 交互的能力,使得 LLM 不僅能夠生成文本,還能夠根據需要調用外部工具來執行特定任務。
對于模型公司來說,Tool Usage 已經成為一個必備的能力。這里列舉了頭部的模型公司如 OpenAI、Anthropic、Cohere 等以及模型工具框架 LangChain。
最近對于直接使用模型公司提供的 Tool Usage 還是使用便捷但封裝較多的 LangChain 框架,最近應用開發者傾向于給出了一個結論,放棄 LangChain 選擇直接編寫 API 和調用數據庫。“由于 LangChain 故意將許多細節做得很抽象,我們無法輕松編寫所需的底層代碼,在抽象上構建抽象,實際使你的代碼變得不必要的復雜”,這是一位算法工程師對 LangChain 的直觀吐槽。
當數字員工或 Agent 成為未來工作的主要載體時,如何確保人工智能安全地訪問和控制在線用戶賬戶成為一個 AI Native 的賽道機會。
ANON:提供身份驗證和授權服務,確保系統的安全性和用戶數據的隱私。 開發人員可以利用用戶許可的集成,代表最終用戶采取“行動”,并完全使用 Anon 的基礎設施進行管理。該公司日前獲得了包括 Producthunt 創始人,Replit 創始人在內的 650 萬美金的投資。
Statics.ai:專注于授權管理和數據保護,幫助開發者安全地管理用戶權限。Mindware:提供身份驗證和授權管理工具,支持復雜的訪問控制。
Clerk:致力于創建一套可嵌入的 UI、API和管理儀表盤,提供身份驗證和用戶管理服務,簡化用戶注冊和登錄流程。Clerk 在 2024 年 1 月獲得了包括 a16z,Stripe,Madrona 在內的 3,000 萬美金 B 輪投資。“授權一直是我們產品愿景的一部分,但我們需要一個成功的身份驗證產品來構建它”,Clerk 正在和 Stripe 進行深度合作,創建授權解決方案。
Agent as a Service 是一種服務模式,允許用戶通過 API 訪問和使用云端的 AI Agent。這些 Agents 可以執行各種任務和操作,如數據處理、自動化任務、自然語言處理等,而無需用戶在本地部署或管理。
其中 Tiny Fish、Reworkd、basepilot、induced、Superagent、Browse AI,提供 UI 自動化服務,能夠自動執行用戶界面相關的任務,如數據抓取、自動填表、用戶操作模擬等,模擬人工操作,提高效率和準確性。
在這篇文章中《深度揭秘|AI時代最火的孵化器在做什么》,我們盤點了美國最火的早期投資機構 AI Grant 在 Batch3 中布局的項目,其中有好幾個公司就是這類以 Agent as a Service 方式運行的,比如 Reworkd 幫助用戶實現規模化的網頁信息提取,將數據提取速度提高100倍,實現從數百個站點檢索數據,無需開發人員,其自動化的任務包括制造業收集產品信息,電商行業獲得競品價格,招聘行業獲得職位列表,銷售職業批量獲取Leads,房地產行業獲取房屋列表等。
而 Induced AI 則是被 Open AI 的 Sam Altman、AI Grant 投資的一個專注瀏覽器原生的工作流程自動化公司。該項目由兩名青少年創立,分別是 18 歲的Sharma 和 19 歲的 Ayush Pathak。他們希望能為瀏覽器的原生工作流程構建一個集成經濟。
目前,Induced AI 在 Chromium 上專門構建了一個瀏覽器環境,專為自主工作流程運行而設計。它有自己的內存、文件系統和身份驗證憑據(電子郵件、電話號碼),可以執行復雜的流程。據我所知,我們是第一個采用這種方法重新設計瀏覽器以供原生 AI 代理使用的公司。因此,復雜的登錄、2FA(我們自動填寫授權碼/短信)、文件下載、存儲和重復使用數據是其他自主代理無法做到的。
NPi AI、Imprompt,提供智能工具選擇和推薦服務,幫助開發者在不同場景下選擇最合適的工具。
Browserbase、browserless、APIFY、Cloudflare、bright data、platform.sh,提供瀏覽器基礎設施和服務,支持大規模數據采集、自動化測試和內容抓去等,側重于對與底層瀏覽器的支持和管理。
以 Browserbase 為例,該項目于近期獲得了來自 Vercel CEO、 Kleiner Perkins、AI Grant 等投資的 650 萬美金的種子輪。
該項目創建了一個無頭瀏覽器(Headless Browser),是一種沒有圖形用戶界面(GUI)的瀏覽器,能夠加載和解析網頁,執行JavaScript代碼,以及進行網絡請求和響應等操作。相比普通的瀏覽器,其主要優點在于節省資源,用編程形式控制,效率更高。Browserbase 認為這是瀏覽器執行 Agent 任務比較好的方式,旨在簡化 Web 自動化流程,讓開發人員能夠更輕松地創建和管理復雜的工作流程。
目前 Browserbase 的新增瀏覽器會話數達到 100 萬次,是他們連續第四周實現 100% 的增長。Browserbase 正在通過 2B2C 的方式走進 Agent 應用,為各類 Agent、助理類 AI 應用提供網頁自動化的任務處理能力。
今年開始,國內的大量AI應用也開始初見產品價值,從 ToB 延伸到 ToC,從生產力和效率延伸到綜合的社交娛樂和其他的多模態等各個領域。Agentic applicaitons 發展呈現出多元化、深入化的趨勢。
在海外創投生態,通過 Agent 思路解決應用場景問題成為一條廣泛認可的 AI 創業路徑。
AI 搜索引擎 Perplexity 今年連續完成兩輪融資估值超 25 億美元,5月的訪問量達 6742 萬次,付費用戶超過 10 萬人。
AI 企業級搜索引擎 Hebbia 剛剛宣布獲得了由 a16z、Index Ventures、Google Ventures 等主流機構投資的 1.3 億美金,估值達到 7 億美金。Hebbia 專為知識工作者設計,幫助客戶用 AI Agent 完成日常知識工作。目前,Hebbia 已在全球領先的資產管理公司、律師事務所、銀行和財富 100 強公司大規模部署,其宣稱產品占據 OpenAI 日調用量的 2%,在過去 18 個月收入增長了 15 倍。
Cognition AI 開發的 Devin AI 首款自主 AI 軟件工程師,與 copilot 不同, Devin 能夠從頭到尾處理整個軟件開發項目。公司目前估值達 20 億。
MultiOn?一款私人 AI Agent,希望能將人類從單調重復的瑣事中解放出來,能夠幫助用戶管理日常事務,幫助企業自動執行重復性任務。當前估值超 5000 千萬美金,詳情可見《AI+生活|MultiOn:幫用戶定機票酒店,斯坦福的兩位創業者讓 RPA 真正賦能用戶生活》。
還有更多 Agent 生態鏈上的公司正在獲得資本市場和用戶市場的認可。
當前 AI Agent 和其基礎設施的發展還處于非常早期的階段,我們能看到的是一系列尚未商業化或整合到更廣泛服務中的運營服務和開源工具。
冪簡集成在未來會為各主流AI Agent 研發工具提高快速集成開放API的插件,把4000種在線API一站集成,讓AI Agent像插入網線快速接入互聯網API體系,實現真正的全球化計算。
在這個領域,誰會成為最后的贏家還遠未明確——這些最終的贏家可能今天還非常年輕,甚至還未出現。
原文轉自 微信公眾號@SenseAI