過去一年,海外科技巨頭Google、Microsoft、OpenAI 和其他公司都在致力于Agentic AI的布局,投資或構(gòu)建軟件庫和框架以支持Agent功能和LLM 驅(qū)動的應(yīng)用程序。

比如Microsoft Copilot、Amazon Q 和Google 即將推出的Project Astra,正在從基于知識轉(zhuǎn)變?yōu)楦踊谛袆印dept、crewAI 和Imbue等公司和研究實驗室,也在開發(fā)基于智能體的模型和多智能體系統(tǒng)。

國內(nèi)也是一樣。目前字節(jié)跳動、百度、阿里巴巴、騰訊等都推出了自己的智能體及構(gòu)建平臺,阿里最近還投資了推出秘塔搜索的秘塔科技,大量科技企業(yè)都在研發(fā)他們的智能體產(chǎn)品,基于AI Agent的項目也越來越多。

Agentic workflow已被公認(rèn)為AI Agent的下一步趨勢,很多人都認(rèn)同吳恩達等專家教授的觀點:智能體工作流是釋放大型語言模型真正潛力的關(guān)鍵,也是實現(xiàn)通過上下文學(xué)習(xí)的目標(biāo)的核心。

現(xiàn)在很多相關(guān)的項目及產(chǎn)品都開始支持整合與兼容Agent工作流,出現(xiàn)了更多的Agentic workflow開源項目。

在GitHub上,Dify已累積了42w+的星標(biāo),F(xiàn)lowise的星標(biāo)接近19w,F(xiàn)astGPT的星標(biāo)也超過了16w。而AutoGen、LangGraph、DB-GPT等開源項目,也已成為企業(yè)和開發(fā)者構(gòu)建智能體工作流的神兵利器。

除了以上幾個耳熟能詳?shù)捻椖浚瑥腁gentic workflow提出到現(xiàn)在不到半年的時間里,還有哪些相關(guān)的開源項目值得關(guān)注、學(xué)習(xí)和應(yīng)用?本文,王吉偉頻道為整理了20個構(gòu)建Agentic workflow的開源項目,幫助大家更好地理解與應(yīng)用智能體工作流。

1、Dify

開源LLM 應(yīng)用程序開發(fā)平臺,結(jié)合AI 工作流、RAG 管道、Agent功能、模型管理、可觀察性功能等,快速從原型進入生產(chǎn)。

項目地址:https://github.com/langgenius/dify?tab=readme-ov-file

中文官網(wǎng):https://dify.ai/cn

體驗地址:https://cloud.dify.ai/apps

Dify是一個開源的大型語言模型(LLM)應(yīng)用開發(fā)平臺。它直觀的界面融合了人工智能工作流、RAG(Retrieval-Augmented Generation)流程、智能體能力、模型管理、可觀測性特性等,讓您能夠快速從原型階段過渡到生產(chǎn)階段。以下是核心特性:

通過這些特性,Dify平臺為開發(fā)人員提供了一個強大而靈活的工具集,以構(gòu)建、測試和部署基于LLM的應(yīng)用程序,加速開發(fā)流程,并提高最終產(chǎn)品的質(zhì)量和性能。

Dify也是著名的AI Agent構(gòu)建平臺之一,大家可以通過上面的體驗地址,在線構(gòu)建AI Agent及Agentic workflow。

2、FastGPT

基于 LLM 構(gòu)建的基于知識的平臺,提供一套全面的開箱即用功能,例如數(shù)據(jù)處理、RAG 檢索和視覺 AI 工作流編排項目地址:https://github.com/labring/FastGPT

官網(wǎng):https://fastgpt.in/

FastGPT項目是一個基于大型語言模型(LLM)構(gòu)建的開源知識庫問答平臺。它提供了一系列即用型功能,如數(shù)據(jù)處理、模型調(diào)用、RAG檢索以及可視化AI工作流編排,使得用戶可以輕松開發(fā)和部署復(fù)雜的問答系統(tǒng),而無需進行廣泛的設(shè)置或配置。

FastGPT的主要能力包括:

FastGPT從V4版本開始采用新的交互方式構(gòu)建AI應(yīng)用,使用Flow節(jié)點編排工作流,提高可玩性和擴展性。FastGPT支持多種模型,包括但不限于OpenAI的GPT系列、Claude、文心一言等,并且項目開源,允許社區(qū)貢獻和二次開發(fā)。它適用于構(gòu)建特定領(lǐng)域的AI客服、自動化數(shù)據(jù)預(yù)處理、工作流編排等場景,提供了簡易模式和高級編排能力,以適應(yīng)不同用戶的需求。

開發(fā)者可以通過Sealos進行一鍵部署,或者使用Docker Compose進行快速部署。FastGPT還提供了詳細的開發(fā)與部署指南,包括系統(tǒng)配置文件說明、多模型配置、版本更新/升級操作等。

3、AutoGen:agentic

AI的編程框架項目地址:https://github.com/microsoft/autogen案例庫:https://microsoft.github.io/autogen/docs/Gallery

AutoGen是由微軟、賓夕法尼亞州立大學(xué)和華盛頓大學(xué)的合作研究團隊共同開發(fā)的開源編程框架,旨在簡化人工智能智能體的構(gòu)建和開發(fā),以及促進多個智能體之間的協(xié)作,共同解決問題。AutoGen的目標(biāo)是降低AgentAI開發(fā)和研究的門檻,其作用類似于PyTorch在深度學(xué)習(xí)領(lǐng)域的貢獻。該框架提供了一系列功能,包括:

AutoGen框架能夠以極低的工作量快速構(gòu)建基于多智能體對話的新一代LLM應(yīng)用程序。它簡化了復(fù)雜的LLM工作流的編排、自動化和優(yōu)化過程,充分發(fā)揮了LLM模型的潛力,同時克服了它們的局限性。

該框架支持多種對話模式,適用于復(fù)雜的工作流程。開發(fā)人員可以利用AutoGen提供的可定制和可對話的智能體,構(gòu)建出不同規(guī)模和結(jié)構(gòu)的對話系統(tǒng),無論是簡單的一對一對話還是復(fù)雜的多智能體交流網(wǎng)絡(luò)。

AutoGen還提供了一系列不同復(fù)雜度的工作系統(tǒng)示例,覆蓋了多個領(lǐng)域和不同程度的應(yīng)用場景,展示了其在支持多樣化對話模式方面的靈活性和強大能力。

此外,AutoGen還增強了LLM的推理能力,提供了包括API統(tǒng)一管理、緩存機制等實用工具,以及高級功能,如錯誤處理、多配置推理、上下文編程等,以滿足更高級的使用需求。這些特性使得AutoGen成為一個功能全面、高效的AI智能體開發(fā)框架。

以下是兩個使用AutoGen的案例

1、autogen_focus_group:虛擬焦點小組,包含自定義角色、產(chǎn)品詳細信息和使用 AutoGen、Ollama/Llama3 和 Streamlit 創(chuàng)建的最終分析。

2、Research agent 3.0:基于Autogen + GPT 建立了AI Agent團隊,能夠生成高質(zhì)量的研究并驗證彼此的工作。

4、Flowise

拖放UI以構(gòu)建您的自定義LLM流程項目地址:https://github.com/FlowiseAI/Flowise

官網(wǎng):https://flowiseai.com/

文檔:https://docs.flowiseai.com/

Flowise是一個開源的低代碼工具,專為開發(fā)者設(shè)計,以便快速構(gòu)建定制化的LLM(大型語言模型)工作流和AI智能體。它基于LangChain.js提供,通過拖放式的用戶界面,使用戶無需編寫代碼即可輕松創(chuàng)建強大的AI應(yīng)用程序,如聊天機器人、智能客服和知識問答等。

Flowise的主要特點包括:

安裝部署方面,F(xiàn)lowise支持NPM部署和Docker部署。通過簡單的命令行操作即可啟動Flowise,并通過瀏覽器訪問其用戶界面進行進一步的操作。

此外,F(xiàn)lowise還提供了應(yīng)用市場,其中包含預(yù)配置的應(yīng)用程序,幫助用戶快速構(gòu)建原型,縮短開發(fā)時間。Flowise的文檔和社區(qū)支持也為用戶提供了豐富的學(xué)習(xí)資源和交流平臺。

Flowise作為一個無代碼的LLM應(yīng)用程序構(gòu)建平臺,極大地降低了開發(fā)AI應(yīng)用的門檻,提高了開發(fā)效率,使得構(gòu)建個性化的AI解決方案變得更加容易和快捷。

5、PhiData

使用內(nèi)存、知識和工具構(gòu)建AI助手項目地址:https://github.com/phidatahq/phidata

文檔:https://docs.phidata.com/introduction

PhiData是一個開源框架,專為構(gòu)建具有長期記憶、豐富知識和執(zhí)行操作能力的AI助手(也稱為智能體或Agent)而設(shè)計。它通過提供記憶、知識和工具的整合,增強了傳統(tǒng)大型語言模型(LLMs)的能力,使其能夠更加智能和自適應(yīng)地響應(yīng)用戶需求 。

PhiData的設(shè)計理念是,一個Assistant是以LLM為核心,加上長期記憶(Memory)、知識(結(jié)構(gòu)化、非結(jié)構(gòu)化)和工具(Tools,比如搜索、api調(diào)用等),這樣就組成了一個完整的Assistant。基于這一理念,PhiData可以幫助用戶方便構(gòu)建助手應(yīng)用,這些助手不僅擁有長期記憶,能夠記住與用戶的每一次對話,還具備豐富的業(yè)務(wù)知識和執(zhí)行各種動作的能力。

PhiData的核心特點包括:

PhiData還提供了一些高級應(yīng)用,例如與SQL數(shù)據(jù)庫結(jié)合使用進行數(shù)據(jù)分析,以及支持從文本生成結(jié)構(gòu)化數(shù)據(jù)模型的功能 。

作為一個功能強大且靈活的框架,PhiData適用于需要高度定制AI助手和自動化任務(wù)的場景,推動了AI技術(shù)的創(chuàng)新和應(yīng)用 。此外,PhiData框架的安裝簡單直接,通過Python的包管理器pip即可完成安裝 。

用PhiData構(gòu)建AI助手的過程涉及三個主要步驟:創(chuàng)建一個Assistant對象;整合所需的工具、知識庫和存儲;通過Streamlit、FastApi或Django等平臺部署AI應(yīng)用 。

PhiData的應(yīng)用示例包括但不限于利用DuckDuckGo進行網(wǎng)絡(luò)搜索的助手、查詢財務(wù)數(shù)據(jù)的助手、編寫和運行Python代碼的助手、使用SQL進行數(shù)據(jù)分析的助手、從文本生成Pydantic模型的助手及具有知識和存儲功能的PDF助手等 。

6、LangGraph

以圖形形式構(gòu)建彈性語言agents

項目地址:https://github.com/langchain-ai/langgraph

LangGraph是一個基于LangChain之上構(gòu)建的用于構(gòu)建具有狀態(tài)的、多參與者應(yīng)用程序的庫,它與大型語言模型(LLMs)一起使用,以創(chuàng)建Agent和多Agent工作流。它提供了一種新的方式,使用狀態(tài)圖(StateGraph)來構(gòu)建復(fù)雜的智能體應(yīng)用。它允許更精細的控制能力,支持大型語言模型(LLM)的循環(huán)調(diào)用以及在Agent過程中的精細化控制,這在構(gòu)建復(fù)雜智能體時非常有用。

與其他LLM框架相比,它提供了以下核心優(yōu)勢:周期性、可控性和持久性。LangGraph 允許你定義涉及周期的流程,這對于大多數(shù)Agent架構(gòu)至關(guān)重要,這與基于有向無環(huán)圖(DAG)的解決方案不同。作為一個非常底層的框架,它為你的應(yīng)用程序流程和狀態(tài)提供了細粒度的控制,這對于創(chuàng)建可靠的Agent至關(guān)重要。此外,LangGraph 包括內(nèi)置的持久性功能,這使得它能夠支持高級的人工干預(yù)和記憶特性。

LangGraph的設(shè)計思想是通過圖結(jié)構(gòu)來協(xié)調(diào)多個Chain、Agent、Tool等的協(xié)作,支持LLM調(diào)用的“循環(huán)”能力。在LangGraph中,任務(wù)細節(jié)通過Graph進行精確定義,包括節(jié)點與邊的定義,然后基于這個圖來編譯生成應(yīng)用。在任務(wù)運行過程中,會維持一個中央狀態(tài)對象,該對象會根據(jù)節(jié)點的跳轉(zhuǎn)不斷更新。

LangGraph的誕生主要是為了解決LangChain簡單鏈(Chain)不具備“循環(huán)”能力的問題,以及AgentExecutor調(diào)度的Agent運行過于“黑盒”的問題。它提供了一種具備更精細控制能力的框架,來支持更復(fù)雜場景的LLM應(yīng)用。

LangGraph支持持久性,允許Agent記住過去的交互并使用這些信息來指導(dǎo)未來的決策,支持高級的人機循環(huán),使Agent能夠與人類用戶進行更自然、更有效的交互。

LangGraph與LangChain相比,引入了循環(huán)計算,允許節(jié)點根據(jù)圖的狀態(tài)被多次訪問,這對需要迭代處理、反饋循環(huán)和復(fù)雜決策的應(yīng)用至關(guān)重要。它的狀態(tài)執(zhí)行模型不斷更新和傳遞狀態(tài),使計算更加上下文感知和適應(yīng)性強。

7、DB-GPT

具有 AWEL(Agentic Workflow Expression Language)和 Agents的AI原生數(shù)據(jù)應(yīng)用程序開發(fā)框架項目地址:https://github.com/eosphoros-ai/DB-GPT

DB-GPT是一個開源的AI原生數(shù)據(jù)應(yīng)用開發(fā)框架,它結(jié)合了AWEL(Agentic Workflow Expression Language)和智能體(Agents)技術(shù)。其核心目標(biāo)是構(gòu)建大模型領(lǐng)域的基礎(chǔ)設(shè)施,通過開發(fā)多模型管理(SMMF)、Text2SQL效果優(yōu)化、RAG框架及優(yōu)化、Multi-Agents框架協(xié)作、AWEL(智能體工作流編排)等技術(shù)能力,簡化圍繞數(shù)據(jù)庫構(gòu)建大模型應(yīng)用的過程,使得企業(yè)或開發(fā)者可以用更少的代碼搭建自己的專屬應(yīng)用。

DB-GPT的特點包括:

DB-GPT的架構(gòu)方案包括RAG框架、生成式BI(GBI)、微調(diào)框架、數(shù)據(jù)驅(qū)動的Multi-Agents框架、數(shù)據(jù)工廠和數(shù)據(jù)源對接等核心能力,旨在提供企業(yè)報表分析、業(yè)務(wù)洞察以及數(shù)據(jù)的清洗加工等數(shù)智化技術(shù)保障。

DB-GPT還提供了一些子模塊,如DB-GPT-Hub用于微調(diào)以提升Text2SQL效果,DB-GPT-Plugins作為插件倉庫,兼容Auto-GPT,以及GPT-Vis作為可視化協(xié)議和dbgpts作為官方提供的數(shù)據(jù)應(yīng)用倉庫。

DB-GPT支持?jǐn)?shù)據(jù)隱私保護,確保數(shù)據(jù)隱私和安全通過私有化大型語言模型和Agent去標(biāo)識化技術(shù)。它適用于需要處理和分析大量數(shù)據(jù)的場景,如金融、電商、物流、醫(yī)療等,并可以幫助企業(yè)實現(xiàn)高效的數(shù)據(jù)管理、智能決策支持和業(yè)務(wù)流程優(yōu)化。

更多DG-GPT內(nèi)容可閱讀:DB-GPT:螞蟻開源的Text-to-SQL利器

8、Griptape

用于AIAgent和工作流的模塊化Pythons框架,具有思維鏈推理、工具和內(nèi)存項目地址:https://github.com/griptape-ai/griptape

官網(wǎng):www.griptape.ai

Griptape是一個模塊化的Python框架,專為構(gòu)建AI智能體和工作流而設(shè)計,支持思維鏈推理、工具和記憶功能。它提供了一種企業(yè)級的替代方案,與LangChain相媲美,旨在簡化自然語言處理(NLP)任務(wù),提高開發(fā)者處理和理解大量文本數(shù)據(jù)的效率。

該項目基于PyTorch框架構(gòu)建,利用BERT、RoBERTa等預(yù)訓(xùn)練模型,在多種NLP任務(wù)上實現(xiàn)優(yōu)異性能,同時保持代碼的模塊化設(shè)計,易于擴展和定制。Griptape的API設(shè)計簡單易懂,便于非NLP領(lǐng)域的開發(fā)者快速上手,并提供詳盡的文檔和社區(qū)支持,以幫助開發(fā)者快速入門和解決使用中的問題。”Griptape is an enterprise grade alternative to LangChain.”

此外,Griptape框架支持從數(shù)據(jù)預(yù)處理到模型部署的全流程,提供了豐富的工具和庫,幫助開發(fā)者構(gòu)建和部署機器學(xué)習(xí)模型。它支持多種機器學(xué)習(xí)框架,并提供了一些最佳實踐,如數(shù)據(jù)預(yù)處理、模型選擇和超參數(shù)調(diào)優(yōu),以提高模型的準(zhǔn)確性和性能。

Griptape生態(tài)系統(tǒng)還包括多個相關(guān)項目,如Griptape-UI、Griptape-Deploy和Griptape-Data,共同構(gòu)成了一個完整的機器學(xué)習(xí)開發(fā)和部署環(huán)境。”Griptape is a modular Python framework for building AI-powered applications that securely connect to your enterprise data and APIs.”

Griptape框架的推出,將助力開發(fā)者構(gòu)建更加高效的AI工作流,其核心功能包括模塊化配置、多功能支持和易用性,為AI工作流的開發(fā)者帶來更加高效、靈活的工作體驗。”griptape 框架推出,助力構(gòu)建AI工作流”。

9、LLMStack

無代碼多Agent框架,用于使用您的數(shù)據(jù)構(gòu)建 LLM Agent、工作流和應(yīng)用程序項目地址:https://github.com/trypromptly/LLMStack

官網(wǎng):https://llmstack.trypromptly.com

LLMStack是一個開源的低代碼平臺,它使用戶能夠利用大型語言模型(LLMs)構(gòu)建功能強大的AI體驗。這個平臺支持構(gòu)建各種AI應(yīng)用程序,包括文本生成、問題回答、文本摘要、文本翻譯以及媒體生成等。用戶還可以將多個LLMs組合起來構(gòu)建復(fù)雜的AI應(yīng)用,并且可以將個人數(shù)據(jù)連接到LLMStack以增強語言模型,或連接業(yè)務(wù)流程以自動化工作流。

LLMStack的主要特點包括:

LLMStack還提供了一個可視化編輯器,用于創(chuàng)建應(yīng)用程序,這些應(yīng)用程序可以通過API、用戶界面調(diào)用或從Slack、Discord等觸發(fā)。它還允許用戶導(dǎo)入數(shù)據(jù)源,如CSV、PDF、URLs、Youtube等,并將它們用于應(yīng)用程序中,同時支持?jǐn)?shù)據(jù)的共享和變量的使用,以向處理器提供動態(tài)值。

LLMStack的設(shè)計目標(biāo)是降低構(gòu)建AI應(yīng)用的門檻,提高開發(fā)效率,并降低成本,同時確保數(shù)據(jù)的安全性和隱私性。無論是大型企業(yè)還是初創(chuàng)公司,都可以利用LLMStack快速開發(fā)和部署高效的人工智能解決方案。

10、ax-llm/ax

構(gòu)建基于斯坦福大學(xué)DSP論文的LLM驅(qū)動的智能體和智能體工作流項目地址:https://github.com/ax-llm/ax

項目文檔:axllm.dev

DSPy論文:https://arxiv.org/abs/2310.03714

DSPy項目: https://github.com/stanfordnlp/dspy

ax-llm/ax項目是一個用于構(gòu)建大型語言模型(LLM)驅(qū)動的智能Agent和”Agent工作流”的框架,其設(shè)計靈感來源于斯坦福大學(xué)的DSP論文 。這個框架支持與多種LLM和向量數(shù)據(jù)庫的無縫整合,并允許開發(fā)者構(gòu)建RAG(Retrieval-Augmented Generation)管道或協(xié)作Agent來解決復(fù)雜問題。Ax框架提供了一系列高級功能,包括流式驗證、多模態(tài)DSP等。

該項目原名llmclient,更改為“Ax”是為了強調(diào)團隊對于支持智能體工作流的重視。該團隊認(rèn)同包括Andrew Ng教授在內(nèi)等眾多專家的觀點:智能體工作流是釋放大型語言模型真正潛力的關(guān)鍵,也是實現(xiàn)通過上下文學(xué)習(xí)的目標(biāo)的核心。該項目同時深受斯坦福大學(xué)DSPy論文的啟發(fā),ax框架是這些理念融合的產(chǎn)物,為您提供了一個強大的工具,以便構(gòu)建您的智能體應(yīng)用。

ax框架的顯著特點之一是其利用提示簽名與LLM進行高效且類型安全的交互。提示簽名是從簡單簽名自動生成的,可以具有多個輸入和輸出字段。Ax目前支持包括OpenAI、Azure OpenAI、Cohere、Anthropic、Mistral、Groq、DeepSeek、Ollama、Google Gemini和Hugging Face在內(nèi)的多種LLM,同時也支持多種向量數(shù)據(jù)庫,如In Memory、Weaviate、Cloudflare和Pinecone 。

ax還提供了一些其他功能,包括RAG管道、智能分塊、嵌入、查詢、使用優(yōu)化器的自動提示調(diào)整等。它還包括OpenTelemetry跟蹤/可觀察性支持,并提供可投入生產(chǎn)的TypeScript代碼 。

ax框架的安裝非常簡單,可以通過npm或yarn進行安裝,且易于使用。開發(fā)者可以選擇一個AI創(chuàng)建一個提示簽名并執(zhí)行提示程序,還可以通過定義函數(shù)并將其傳遞給提示來啟用函數(shù)調(diào)用 。

11、ControlFlow

控制你的AI Agent項目地址:https://github.com/PrefectHQ/ControlFlow

項目文檔:https://controlflow.ai/welcome

ControlFlow項目是由PrefectHQ發(fā)起的一個Python框架,專門用于構(gòu)建具有Agent性的人工智能工作流。ControlFlow提供了一個結(jié)構(gòu)化且以開發(fā)者為中心的框架,允許用戶定義工作流并將任務(wù)委托給大型語言模型(LLMs),同時不損失控制或透明度:

該框架的設(shè)計理念是將復(fù)雜的AI工作流分解為可管理、可觀察的步驟,即任務(wù)(Tasks)。每個任務(wù)代表一個離散的目標(biāo)或需要完成的目標(biāo),例如生成文本、分類數(shù)據(jù)或從文檔中提取信息。任務(wù)定義了AI工作流中需要完成的”什么”(WHAT)。

在ControlFlow中,AI Agents扮演執(zhí)行任務(wù)的角色,決定了”如何”(HOW)完成任務(wù)。每個Agent可以有針對特定類型任務(wù)的獨特配置、個性和能力。Agent被分配給適合它們特性和可用性的任務(wù),這種任務(wù)和Agent的分離允許創(chuàng)建靈活且功能強大的工作流。

Flows是ControlFlow中的高級容器,用于封裝和協(xié)調(diào)整個AI驅(qū)動的工作流。它們提供一種結(jié)構(gòu)化的方式來管理任務(wù)、Agent、工具和共享上下文。Flows可以維護所有組件的一致狀態(tài)、管理任務(wù)的執(zhí)行順序以及提供Agent協(xié)作的共享上下文。

ControlFlow還提供了任務(wù)中心架構(gòu),允許用戶在維持精細控制的同時利用AI處理復(fù)雜的工作流。通過為每個任務(wù)設(shè)定明確的目標(biāo)和約束,用戶可以在AI的自主性與精確監(jiān)督之間取得平衡,從而充滿信心地構(gòu)建復(fù)雜的AI驅(qū)動應(yīng)用程序。

ControlFlow框架正在積極開發(fā)中,并即將進行首次公開發(fā)布。它旨在解決構(gòu)建既強大又可預(yù)測的AI驅(qū)動應(yīng)用程序的挑戰(zhàn),支持多Agent協(xié)作、生態(tài)系統(tǒng)集成和系統(tǒng)可觀察性,適用于對穩(wěn)定性和維護性有高要求的AI應(yīng)用開發(fā)。

12、beehive

一個靈活的事件/智能體和自動化系統(tǒng)

項目地址:https://github.com/muesli/beehive

由muesli推出的beehive項目是一個靈活的事件/Agent和自動化系統(tǒng),它允許用戶創(chuàng)建自己的Agent來執(zhí)行由事件和過濾器觸發(fā)的自動化任務(wù)。這個系統(tǒng)是模塊化、靈活的,并且非常容易擴展,適合任何人使用。

它擁有模塊(稱之為 “Hives”),因此它可以與Twitter、Tumblr、Email、IRC、Jabber、RSS、Jenkins、Hue等平臺進行接口、對話或信息獲取。

這些模塊相互連接可以創(chuàng)建極其有用的Agent,例如在Tumblr博客上重新發(fā)布推文、將收到的聊天消息轉(zhuǎn)發(fā)到電子郵件賬戶、當(dāng)溫度低于某個值時開啟暖氣系統(tǒng)、運行IRC機器人觸發(fā)Jenkins CI上的構(gòu)建、控制Hue照明系統(tǒng),以及當(dāng)股票價格低于特定值時通知用戶等 。

安裝beehive非常簡單,提供了多種方式,包括Arch Linux的AUR軟件包、Linux和macOS的靜態(tài)二進制文件、Windows的64位版本,以及通過Docker和Ansible的部署工具。此外,還可以從源代碼構(gòu)建,這要求有Go 1.13或更高版本的Go環(huán)境 。

配置beehive涉及到創(chuàng)建“蜜蜂”和設(shè)置“鏈”,通過Web界面可以圖形化地進行配置。用戶可以對事件做出反應(yīng)并執(zhí)行操作,例如監(jiān)控RSS源并在有更新時發(fā)送電子郵件。beehive提供了完整的模板語言來處理事件參數(shù),允許用戶定制化地構(gòu)造動作 。

此外,beehive還提供了開發(fā)支持,包括IRC或Gitter上的社區(qū)討論,以及Twitter上的最新動態(tài)更新。項目的官方倉庫提供了完整的文檔和示例,方便用戶開始他們的beehive之旅 。

13、alan-sdk-web

Generative AI SDK for Web,用于為使用JavaScript、React、Angular、Vue、Ember、Electron 構(gòu)建的應(yīng)用程序創(chuàng)建AI Agent項目地址:https://github.com/alan-ai/alan-sdk-web官網(wǎng):https://alan.app/

alan-sdk-web是由Alan AI提供的一個生成式AI軟件開發(fā)工具包(SDK),專門用于Web平臺。它允許開發(fā)者在基于JavaScript、React、Angular、Vue、Ember和Electron等技術(shù)構(gòu)建的應(yīng)用程序中創(chuàng)建和集成AI智能體。這個SDK旨在幫助開發(fā)者快速將先進的AI功能嵌入到他們的Web應(yīng)用中,而無需對用戶界面進行大量改動或改動最小。

Alan AI提供了一個全面的解決方案,充當(dāng)企業(yè)的“統(tǒng)一大腦”,連接企業(yè)應(yīng)用程序、API和數(shù)據(jù)源,以簡化工作流程。它包括以下幾個核心組件:

使用alan-sdk-web,開發(fā)者需要在Alan AI Studio注冊,構(gòu)建對話腳本,并使用SDK將AI智能體嵌入到Web應(yīng)用或網(wǎng)站中。SDK提供了豐富的API和配置選項,支持自定義AI按鈕、處理命令、播放文本和執(zhí)行其他交互功能。

Alan AI還提供了示例應(yīng)用程序,展示如何在不同框架中使用SDK,以及如何在React應(yīng)用中集成Alan AI,包括如何添加SDK到項目、指定AI按鈕參數(shù)、使用各種方法和處理程序。

Alan AI SDK for Web的版本更新記錄顯示,它持續(xù)增強了文本聊天功能,修復(fù)了UI問題,并增加了額外的配置選項和API。

14、lemon-agent

Plan-Validate-Solve(PVS)Agent實現(xiàn)準(zhǔn)確、可靠和可重復(fù)的工作流程自動化

項目地址:https://github.com/felixbrock/lemon-agent

lemon-agent是一個基于LLM的智能體框架,旨在通過自動化執(zhí)行任務(wù)來提高工作流程的效率和準(zhǔn)確性。也是一個基于ACL 2023論文“Plan-and-Solve Prompting”構(gòu)建,用于精確、可靠和可復(fù)現(xiàn)的工作流自動化的Plan-Validate-Solve (PVS)獨立的監(jiān)督式計劃和解決智能體,可以輕松集成到LangChain等框架中,并與任何模型協(xié)同工作。

lemon-agent不僅是一個工具,更是一整套工作流程自動化解決方案。用戶可以使用Lemon Agent與Airtable、Hubspot、Discord、Notion和GitHub等工具進行交互,并構(gòu)建強大的工作流自動化,讓LLM智能體可靠地執(zhí)行讀寫操作。在功能上 ,目前它支持:

任務(wù)分離與人機交互:Lemon Agent目前具備規(guī)劃智能體(Planner Agent)和解決智能體(Solver Agent),以保持智能體的專注度并提升準(zhǔn)確性。我們計劃很快增加更多類型的智能體。此外,Lemon Agent將在相關(guān)工作任務(wù)流程中請求批準(zhǔn),確保執(zhí)行操作符合預(yù)期。

無限的配置選項:定義工作流時,Lemon Agent為用戶提供了無限的配置選項。例如,可以指示Lemon Agent在執(zhí)行工作流步驟前請求許可,或者在模型每次執(zhí)行工作流步驟時講一個爸爸的笑話。

UI靈活性:可以在Lemon Agent之上構(gòu)建任何用戶界面(UI),或者通過內(nèi)置的命令行界面(CLI)與之交互。

可視化分析:通過使用分析可視化工具,您可以輕松地更好地了解工具的使用頻率和順序。這樣,您就可以識別智能體決策能力中的薄弱環(huán)節(jié),并通過進一步配置您的Lemon Agent工作流,引導(dǎo)其行為更具確定性。

“lemon-agent”項目特別強調(diào)了Plan-Validate-Solve(計劃-驗證-解決)的自動化流程,這意味著它支持智能體在執(zhí)行任務(wù)之前進行詳盡的規(guī)劃,執(zhí)行過程中進行實時驗證,并在遇到問題時進行解決,以確保任務(wù)的順利完成。

15、Lionagi

AGentic Intelligence 操作系統(tǒng)項目地址:https://github.com/lion-agi/lionagi項目文檔:https://ocean-lion.com/Welcome#Why+Automating+Workflows%3F

lionagi是一個智能Agent工作流程自動化框架,旨在實現(xiàn)智能智能體工作流的自動化,通過引入先進的機器學(xué)習(xí)模型到現(xiàn)有的工作流和數(shù)據(jù)基礎(chǔ)設(shè)施中,從而提升效率和智能化水平。

為什么要自動化工作流程?諸如大語言模型 (LLM)之類的智能 AI 模型引入了人機互動的新可能性。LLM 因其“一模型勝任所有工作”的特點和令人難以置信的性能在全球范圍內(nèi)引起了廣泛關(guān)注。使用 LLM 的一種方式是作為搜索引擎使用,然而這種用法因 LLM 的幻覺現(xiàn)象而變得復(fù)雜。

LLM 內(nèi)部的運作更像是一個黑箱,缺乏可解釋性,這意味著我們不知道它是如何得出某個答案或結(jié)論的,因此我們不能完全信任/依賴這樣的系統(tǒng)輸出。使用 LLM 的另一種方法是將其視為智能Agent,配備各種工具和數(shù)據(jù)源。

LionAGI作為智能Agent進行的工作流程有清晰的步驟,可以執(zhí)行明確的工作流,其決策邏輯可指定、觀察、評估和優(yōu)化為執(zhí)行操作而做出的每個決策的邏輯。這種方法,仍然無法準(zhǔn)確指出LLM如何生成其輸出,但流程本身是可解釋的。

LionAGI還可以管理和指導(dǎo)其他Agents,也可以并行使用多個不同的工具。

16、AgentPilot

通用 GUI,可實現(xiàn)AI工作流的無縫交互和管理

項目地址:https://github.com/jbexta/AgentPilot

AgentPilot是一個開源的桌面應(yīng)用程序,它允許用戶創(chuàng)建、管理和與AI智能體進行聊天。這個應(yīng)用程序具備多種功能,包括多智能體支持、分支聊天,并通過LiteLLM與多個提供商進行集成。AgentPilot使用戶能夠在低代碼環(huán)境中配置不同提供商的模型進行交互,并管理它們的語音、個性和操作 。

該應(yīng)用程序目前是0.2版本前的預(yù)發(fā)布版,一些新功能尚未完全實現(xiàn)。新版本引入了語音輸入、文件夾、工具和RAG(Retrieval-Augmented Generation)功能。AgentPilot允許用戶對工作流程進行更好的組織,管理一系列工具,并可以分配給任何智能體以修改它們的功能 。

AgentPilot支持多種插件類型,包括可以覆蓋默認(rèn)智能體行為的“智能體”插件,以及可以覆蓋默認(rèn)工作流行為的“工作流”插件。此外,Open Interpreter已集成到AgentPilot中,可以作為插件獨立使用,也可以由任何智能體來執(zhí)行代碼 。

用戶可以通過Python包索引安裝AgentPilot,或從提供的鏈接下載適用于不同平臺的可執(zhí)行文件。

17、Stately Agent

使用 XState 創(chuàng)建狀態(tài)機驅(qū)動的 LLM Agent項目地址:https://github.com/statelyai/agent

項目文檔:https://stately.ai/docs/agents

Stately Agent是Stately.ai提供的一個基于actor模型和狀態(tài)機創(chuàng)建AI智能體的框架。這些智能體能夠觀察環(huán)境、決定行動方案,并執(zhí)行動作以實現(xiàn)目標(biāo)。Stately Agent框架不僅支持文本生成和函數(shù)調(diào)用,還能夠:

Stately Agent的創(chuàng)建和行為定制非常靈活,可以通過createAgent函數(shù)來創(chuàng)建智能體,并設(shè)置名稱、使用的AI SDK語言模型、智能體能觸發(fā)的事件等。智能體可以與狀態(tài)機進行交互,根據(jù)當(dāng)前狀態(tài)和目標(biāo)來決定下一步行動。此外,Stately Agent還具備記憶功能,包括短期(本地)記憶和長期記憶,能夠記住消息、觀察結(jié)果、反饋和計劃 。

作為一個用于使用狀態(tài)機構(gòu)建AI Agent的靈活框架,Stately Agent 通過以下方式超越了普通的基于LLM的AI Agent:

Stately Agent 還可以與現(xiàn)有的狀態(tài)機actor進行交互,以確定接下來應(yīng)該執(zhí)行的動作,為開發(fā)人員提供了一種強大的方式來構(gòu)建能夠理解環(huán)境、記憶并做出決策的AI智能體 。

18、Graphai

異步數(shù)據(jù)流執(zhí)行引擎,允許開發(fā)人員通過將Agent工作流描述為YAML或JSON中的聲明性數(shù)據(jù)流圖來構(gòu)建Agent應(yīng)用程序

項目地址:https://github.com/receptron/graphai

GraphAI是一個異步數(shù)據(jù)流執(zhí)行引擎,它使得開發(fā)人員能夠通過在YAML或JSON文件中描述智能體工作流的聲明性數(shù)據(jù)流圖來構(gòu)建智能體應(yīng)用程序。

正如Andrew Ng在他的文章“The Batch: Issue 242”中所闡述的,通過分步驟多次調(diào)用大型語言模型,并允許它們逐步構(gòu)建輸出,通常能夠獲得更高質(zhì)量的結(jié)果。吳恩達博士將這種策略稱為“智能體工作流”。

這類智能體應(yīng)用程序涉及到多個異步API調(diào)用(例如,OpenAI的聊天完成API、數(shù)據(jù)庫查詢、網(wǎng)絡(luò)搜索)并需要管理它們之間的數(shù)據(jù)依賴性。隨著應(yīng)用程序復(fù)雜度的提升,由于API的異步特性,按照傳統(tǒng)編程方式管理這些依賴項變得日益困難。

GraphAI賦予了開發(fā)人員一種能力,在YAML或JSON格式的數(shù)據(jù)流圖中描述這些智能體間的依賴關(guān)系(即異步API調(diào)用),這種方式被稱為聲明式數(shù)據(jù)流編程。GraphAI引擎將負責(zé)處理并發(fā)的異步調(diào)用、數(shù)據(jù)依賴性管理、任務(wù)優(yōu)先級控制、map-reduce處理、錯誤處理、重試機制以及日志記錄等所有復(fù)雜任務(wù)。

19、Agentica

用10行代碼構(gòu)建多代理工作流

項目地址:https://github.com/shibing624/agentica

Agentica是一個用于構(gòu)建多智能體工作流的工具,它允許開發(fā)者用極少的代碼量(僅需10行代碼)來創(chuàng)建復(fù)雜的智能體應(yīng)用程序。Agentica項目的核心特點包括支持多種智能體功能,如規(guī)劃(Planning)、記憶(Memory)、工具使用(Tool use)等,以及一個為大型語言模型(LLM)智能體構(gòu)建的框架,它提供了簡單的代碼快速編排智能體的能力,并支持多種功能,例如Reflection(反思)、Plan and Solve(計劃并執(zhí)行)、RAG、多智能體、多角色、工作流等 。

Agentica項目包括三個組件。Planner組件負責(zé)讓LLM生成多步計劃來完成復(fù)雜任務(wù),定義每一步所依賴的上一步的輸出。Worker組件接受這些計劃,并循環(huán)遍歷計劃中的每個子任務(wù),調(diào)用工具完成任務(wù),能夠自動反思糾錯以完成任務(wù)。最后,Solver組件將所有輸出整合為最終答案 。

此外,Agentica項目還提供了多種示例,包括基于文檔的問答、代碼執(zhí)行、科技報告撰寫、新聞稿撰寫等,這些示例展示了Agentica在不同場景下的應(yīng)用能力 。項目還提供了安裝指南和快速入門指南,幫助開發(fā)者快速開始使用Agentica構(gòu)建自己的智能體應(yīng)用程序 。

Agentica項目由shibing624維護,它是一個開源項目,鼓勵社區(qū)貢獻,并且提供了詳細的文檔和示例來幫助開發(fā)者學(xué)習(xí)和使用 。項目還提供了如何引用Agentica的學(xué)術(shù)引用格式,以便于在研究中使用Agentica時進行適當(dāng)?shù)囊?/p>

20、GroqAgenticWorkflow

快節(jié)奏、基于智能團隊合作的座席工作流程

項目地址:https://github.com/Drlordbasil/GroqAgenticWorkflow

GroqAgenticWorkflow由Drlordbasil發(fā)起,旨在通過智能體的合作來實現(xiàn)任務(wù)的高效執(zhí)行和流程的自動化。這是一個快節(jié)奏、基于智能團隊協(xié)作的智能工作流項目,一個創(chuàng)新的人工智能系統(tǒng),它利用Groq技術(shù)自主生成有盈利潛力的Python腳本。該平臺整合了專業(yè)的AI智能體、先進的NLP技術(shù)和前沿的語言模型,構(gòu)建了一個自我維持的開發(fā)生態(tài)系統(tǒng)。其主要特性如下:

GroqAgenticWorkflow在革命性的AI驅(qū)動架構(gòu)上運行,架構(gòu)中包括幾個智能體角色:

創(chuàng)意生成:Bob,產(chǎn)品管理AI,根據(jù)市場趨勢提出項目創(chuàng)意;

架構(gòu)設(shè)計:AI架構(gòu)師Mike,負責(zé)軟件結(jié)構(gòu)設(shè)計和算法選擇;

開發(fā):AI開發(fā)人員Annie,負責(zé)代碼編寫、測試和優(yōu)化;

DevOps和部署:DevOps AI Alex,管理基礎(chǔ)設(shè)施和部署流程;

持續(xù)優(yōu)化:團隊協(xié)作,持續(xù)改進代碼庫和流程。

GroqAgenticWorkflow不僅是開發(fā)工具,也有機會成為推動各行業(yè)創(chuàng)新的催化劑,拓寬AI驅(qū)動解決方案的邊界。其未來愿景包括利用AI進行市場分析和趨勢預(yù)測、自動生成移動和Web應(yīng)用程序、AI智能體自我進化及實現(xiàn)持續(xù)改進、構(gòu)建基于區(qū)塊鏈的去中心化協(xié)作網(wǎng)絡(luò)。

?文/王吉偉

原文轉(zhuǎn)自 微信公眾號@王吉偉

上一篇:

13個人工智能AI訓(xùn)練數(shù)據(jù)集推薦

下一篇:

在雜貨零售中利用Rasa對話式 AI
#你可能也喜歡這些API文章!

我們有何不同?

API服務(wù)商零注冊

多API并行試用

數(shù)據(jù)驅(qū)動選型,提升決策效率

查看全部API→
??

熱門場景實測,選對API

#AI文本生成大模型API

對比大模型API的內(nèi)容創(chuàng)意新穎性、情感共鳴力、商業(yè)轉(zhuǎn)化潛力

25個渠道
一鍵對比試用API 限時免費

#AI深度推理大模型API

對比大模型API的邏輯推理準(zhǔn)確性、分析深度、可視化建議合理性

10個渠道
一鍵對比試用API 限時免費