很難現(xiàn)在就判定 Manus 的誕生就是 AGI 的里程碑,但它很有可能將讓 Agent (智能體)時(shí)代真的進(jìn)入「高潮時(shí)刻」。

Manus 體驗(yàn)申請(qǐng)鏈接 ??:
https://manus.im/invitation

篩簡(jiǎn)歷、選房炒股,Manus 真會(huì)「干活」?

官方宣稱(chēng),Manus 不僅僅是一個(gè)只會(huì)聊天的對(duì)話式 AI 工具,而是一個(gè)真正的自主智能體(Agent)。

當(dāng)其他 AI 可能只停留在生成想法的階段,而 Manus 能夠獨(dú)立思考并采取行動(dòng)。官方將其視為人機(jī)協(xié)作的新范式,甚至可能是通向 AGI 的一個(gè)窗口。

與 Manus 同步出圈的還有一段長(zhǎng)達(dá)四分鐘的演示 demo。在這些案例中,Manus 完全自主地完成從規(guī)劃到執(zhí)行的全流程,展示了真正的 Agent 能力,而非簡(jiǎn)單的助手功能。

比方說(shuō),首先從一個(gè)常見(jiàn)的人力資源任務(wù)——篩選簡(jiǎn)歷開(kāi)始。

演示一開(kāi)始就放了個(gè)大招,官方向 Manus 發(fā)送了一個(gè)包含 10 份簡(jiǎn)歷的壓縮文件,Manus 能像專(zhuān)業(yè)招聘人員一樣高效工作。

它會(huì)先解壓文件,然后逐頁(yè)瀏覽每份簡(jiǎn)歷,并記錄重要信息。Manus 還能異步處理文件,這意味著你可以隨時(shí)關(guān)閉電腦,等任務(wù)完成后,它會(huì)通知你。

當(dāng)然,在這個(gè)過(guò)程中,你也可以隨時(shí)給它新的指令。

接著,繼續(xù)向 Manus 上傳 5 份簡(jiǎn)歷。在認(rèn)真閱讀了所有 15 份簡(jiǎn)歷后,Manus 給出了排名建議,并提供了候選人資料和評(píng)估標(biāo)準(zhǔn)作為參考。

這還沒(méi)完,我們還可以讓 Manus 生成電子表格。

由于 Manus 具有知識(shí)和記憶能力,所以下次執(zhí)行類(lèi)似任務(wù)時(shí),它會(huì)直接以電子表格的形式交付結(jié)果。

另一個(gè)演示案例中,結(jié)合家庭收入情況和孩子的上學(xué)要求,讓 Manus 在紐約篩選一個(gè)安全、犯罪率低的社區(qū),并購(gòu)買(mǎi)符合標(biāo)準(zhǔn)的房產(chǎn)。

面對(duì)這類(lèi)復(fù)雜任務(wù),Manus 同樣是有條不紊地將其拆解為多個(gè)步驟,并創(chuàng)建詳細(xì)的待辦清單。

轉(zhuǎn)場(chǎng)到第三個(gè)案例,Manus 搖身一變成了專(zhuān)業(yè)的股票分析師。

讓其分析英偉達(dá)、邁威爾科技,以及臺(tái)積電在過(guò)去 3 年的股票價(jià)格之間的相關(guān)性,Manus 可以通過(guò) API 訪問(wèn)權(quán)威數(shù)據(jù)源。在驗(yàn)證數(shù)據(jù)后,它開(kāi)始編寫(xiě)用于數(shù)據(jù)分析和可視化的代碼。

在完成數(shù)據(jù)分析和可視化后,Manus 也能基于這些數(shù)據(jù)創(chuàng)建一個(gè)網(wǎng)站。經(jīng)用戶的授權(quán)后,還能將網(wǎng)站部署至線上,并提供了一個(gè)可供分享的鏈接。

X 網(wǎng)友 @DavidAIinchina 體驗(yàn) Manus 過(guò)后,給出了極高的評(píng)價(jià)——「令人難以置信的用例」。

官方表示,以上展示的內(nèi)容僅僅是 Manus 能力的冰山一角。

官網(wǎng)(https://manus.im/usecases)還分享了 Manus 更多處理現(xiàn)實(shí)世界任務(wù)的案例。從個(gè)性化旅行規(guī)劃、深度股票分析、保險(xiǎn)政策比較、供應(yīng)商采購(gòu)、財(cái)務(wù)報(bào)告分析到專(zhuān)業(yè)數(shù)據(jù)整理等,Manus 都能應(yīng)付自如。

盡管 Manus 尚未全面開(kāi)放,但其熱度已席卷全網(wǎng)。各大平臺(tái)上,網(wǎng)友們紛紛深夜涌入評(píng)論區(qū)詢問(wèn)邀請(qǐng)碼,其火爆程度可見(jiàn)一斑。

而在用于評(píng)估通用 AI 助手在解決現(xiàn)實(shí)世界問(wèn)題方面的能力的 GAIA 基準(zhǔn)測(cè)試中,Manus 在所有三個(gè)難度級(jí)別上都達(dá)到了 SOTA 水平。

為了確保結(jié)果的可重復(fù)性,Manus 使用與其正式版本完全一致的配置進(jìn)行評(píng)測(cè)。

除了基準(zhǔn)測(cè)試,Manus 還在 Upwork 和 Fiverr 等平臺(tái)上解決真實(shí)世界的問(wèn)題,并在 Kaggle 競(jìng)賽中證明了自己的實(shí)力。

而這一切都離不開(kāi)優(yōu)秀的開(kāi)源社區(qū),因此官方也希望能回饋社區(qū)。

Manus 采用多重簽名(multisig)系統(tǒng),由多個(gè)獨(dú)立模型驅(qū)動(dòng)。今年晚些時(shí)候,官方將計(jì)劃開(kāi)源其中的一些模型,特別是 Manus 的推理(postering)部分。

中國(guó)團(tuán)隊(duì)、多款爆品、百萬(wàn)用戶

那么這款震撼業(yè)界的產(chǎn)品背后是誰(shuí)?

據(jù)悉,Manus AI 背后的創(chuàng)始人肖弘是華中科技大學(xué)軟件工程專(zhuān)業(yè) 2015 屆校友。

畢業(yè)后,他連續(xù)創(chuàng)業(yè),2015 年創(chuàng)立夜鶯科技,推出「壹伴助手」和「微伴助手」,服務(wù)超 200 萬(wàn) B 端用戶,獲騰訊、真格基金等投資。

縈繞在肖弘身上的還有一個(gè)更鮮明的 AI 產(chǎn)品——Monica。

這是一款號(hào)稱(chēng) All-in-One 的 AI 助手,最初以瀏覽器插件的形式推出。

通過(guò)集成主流大模型(如 Claude 3.5、DeepSeek 等),Monica 提供聊天、翻譯、文案處理等功能,用戶可通過(guò)自然語(yǔ)言創(chuàng)建定制化工具,并共享至工具廣場(chǎng)。

Monica 同樣是早期以海外市場(chǎng)為主,用戶規(guī)模破百萬(wàn),成為 AI 插件領(lǐng)域頭部產(chǎn)品。

今年 2 月份,Monica 的中文版(monica.cn)已開(kāi)啟內(nèi)測(cè),目前免費(fèi)向國(guó)內(nèi)用戶開(kāi)放。該版本基于DeepSeek R1 和 V3 模型打造,具備深度推理思考能力,并支持記憶功能和實(shí)時(shí)聯(lián)網(wǎng)搜索。

Manus 的技術(shù)哲學(xué):less structure more intelligence

Manus 奉行的技術(shù)理念與主流也有些不同,是 「less structure more intelligence.」(更少的結(jié)構(gòu),更多的智能)

他們認(rèn)為,當(dāng)數(shù)據(jù)足夠優(yōu)質(zhì)、模型足夠強(qiáng)大、架構(gòu)足夠靈活、工程足夠扎實(shí)時(shí),computer use、deep research、coding agent 等能力會(huì)自然涌現(xiàn),無(wú)需被設(shè)計(jì)為特定的產(chǎn)品功能。

作為大力出奇跡的代表之一,GPT-4-Turbo 在 GAIA 公開(kāi)排行榜上的平均成績(jī)不到 7%,即使是使用復(fù)雜多智能體系統(tǒng)的解決方案也僅達(dá)到 40%。Manus 的表現(xiàn)可以說(shuō)是「遙遙領(lǐng)先」。

創(chuàng)始人肖弘在最近在和張小珺的訪談中,他也提前談到了當(dāng)時(shí)還未發(fā)布的 Agent 產(chǎn)品 Manus 。

「看上去它確實(shí)應(yīng)該就是一個(gè) chatbot,這是很符合大家想象的,同時(shí)在應(yīng)用側(cè)卻很復(fù)雜,和 Monica 不一樣,光用好不同模型就挺復(fù)雜。」

肖弘還將目前 AI 應(yīng)用分為兩類(lèi):一是填補(bǔ)主要應(yīng)用產(chǎn)品的空檔的不足,二是為特定場(chǎng)景提供獨(dú)特解決方案的應(yīng)用。

比如 Perplexity (提供聯(lián)網(wǎng)搜索功能) 和 Monica (瀏覽器插件形態(tài)) 都屬于此類(lèi),它們填補(bǔ)了現(xiàn)有產(chǎn)品留下的空白。

而模型驅(qū)動(dòng)的新場(chǎng)景這類(lèi)應(yīng)用,主要出現(xiàn)在圖片和視頻領(lǐng)域,直接由模型技術(shù)的進(jìn)步驅(qū)動(dòng)。像 Pika 和 Runway 等產(chǎn)品利用模型能力創(chuàng)造了新的應(yīng)用場(chǎng)景。

有用戶調(diào)侃 Manus 是「極致的套殼就是牛逼」,實(shí)際上肖弘并不忌諱讓用戶知道自己的產(chǎn)品用的是別人的模型。早在去年,他就把 Monica 比作消費(fèi)電子產(chǎn)品,并把 ChatGPT 的 Logo 打在官網(wǎng)。

人機(jī)交互新時(shí)代已來(lái),但別急著把 Manus 捧上 AGI 神壇

APPSO 在 2024 年年初曾作出一個(gè)預(yù)測(cè):大模型將成為智能手機(jī)新的操作系統(tǒng),自然用戶界面(Natural user interface, NUI )將逐步替代現(xiàn)有的圖形用戶界面(GUI)。

而實(shí)現(xiàn)這種新交互的重要入口,就是 Agent 。

去年我們?cè)诤芏嗍謾C(jī)的發(fā)布會(huì)上都看到類(lèi)似的案例。vivo 發(fā)布會(huì)展示可以 AI 訂餐的 「Phone GPT」,華為鴻蒙的小藝和意圖框架,還是榮耀的 YOYO 智能體,以及智譜的 AutoGLM,核心都是一樣的:

讓 AI 模仿人類(lèi)的 Plan-Do-Check-Act(計(jì)劃-執(zhí)行-檢查-行動(dòng))循環(huán) ,從而像人類(lèi)那樣去操作設(shè)備。

智譜 AI CEO 張鵬之前提到,目前的 Agent 能力更像是在用戶和應(yīng)用之間,增加一個(gè)智能的調(diào)度層,鏈接所有應(yīng)用甚至是所有設(shè)備。

這可以看做是大模型通用操作系統(tǒng) LLM-OS的一種雛形,將對(duì)人機(jī)交互形式產(chǎn)生極大的影響。OpenAI 創(chuàng)始成員、AI 技術(shù)大牛 Andrej Karpathy 也曾多次談到大語(yǔ)言模型操作系統(tǒng)(LLM OS)。

他認(rèn)為大模型某種程度來(lái)說(shuō)就是一種新的計(jì)算機(jī)和操作系統(tǒng),它可以連接各種軟件和硬件,以及所有模態(tài)信息組成的外設(shè),并通過(guò)函數(shù)調(diào)用執(zhí)行各種任務(wù)。

傳統(tǒng)操作系統(tǒng)中,你需要圍繞 CPU 構(gòu)建一堆外設(shè),比如鼠標(biāo)和鍵盤(pán)、磁盤(pán)存儲(chǔ)、以及緩存空間等。而在 LLM OS 中,大模型本身就是中央處理器。

I/O 外設(shè)也不再是鼠標(biāo)和鍵盤(pán),因?yàn)?LLM 可以兼容更多模態(tài)的數(shù)據(jù)輸入和輸出。同時(shí)大模型調(diào)用的外部工具也將從傳統(tǒng)軟件升級(jí)為智能體工具。

其中跨應(yīng)用的操作是非常關(guān)鍵的一環(huán),這意味著 Agent 能實(shí)現(xiàn)更加復(fù)雜的自主連貫操作,也可能走向真正的商業(yè)化落地。至于各家互聯(lián)網(wǎng)公司提供的服務(wù)能否打通,可能是未來(lái)實(shí)現(xiàn)這種交互最大的障礙。

不過(guò)現(xiàn)在很多 AI 助手實(shí)現(xiàn)代操作的方式,實(shí)際上是調(diào)用手機(jī)的無(wú)障礙功能 (accessibility features) 的權(quán)限,來(lái)控制屏幕點(diǎn)擊。

Manus 的出現(xiàn),意味著 Agent 模式下的 AI 能夠理解需求后獨(dú)立工作,直到任務(wù)完成。這無(wú)疑是人機(jī)交互領(lǐng)域的一大步,它讓我們看到了 AI 從工具向伙伴轉(zhuǎn)變的潛力。

但要說(shuō)我們已經(jīng)一只腳邁入了 AGI 大門(mén),也還為時(shí)尚早。肖弘自己也提到,早期的 Agent 更像是「功能機(jī)」,需要不斷迭代和完善。目前的 Agent 仍需依賴于模型能力的提升,以及更完善的虛擬環(huán)境支持,才能真正勝任各種長(zhǎng)尾任務(wù)。

如果類(lèi)比智能駕駛,大概也相當(dāng)于從 L2 級(jí)升級(jí)到 L3 級(jí)的輔助駕駛。雖然 Manus 在 GAIA 基準(zhǔn)測(cè)試中表現(xiàn)出色,但這并不意味著它已具備通用人工智能的全部特征。通往 AGI 的道路依然漫長(zhǎng),需要解決模型能力、自主學(xué)習(xí)、任務(wù)泛化等多重挑戰(zhàn)。

但因?yàn)橛辛?Manus 在自主性與通用性上的突破,通往 AGI 的大航海中,又多了一顆照亮我們的星。

文章轉(zhuǎn)載自: 這個(gè)中國(guó) AI 產(chǎn)品一夜刷屏!全網(wǎng)都在要邀請(qǐng)碼,可能是 DeepSeek 后最大驚喜

上一篇:

深度學(xué)習(xí)入門(mén)系列:VGG、NiN、GoogleNet

下一篇:

DeepSeek 對(duì)加密貨幣Bitcoin比特幣的分析與未來(lái)展望
#你可能也喜歡這些API文章!

我們有何不同?

API服務(wù)商零注冊(cè)

多API并行試用

數(shù)據(jù)驅(qū)動(dòng)選型,提升決策效率

查看全部API→
??

熱門(mén)場(chǎng)景實(shí)測(cè),選對(duì)API

#AI文本生成大模型API

對(duì)比大模型API的內(nèi)容創(chuàng)意新穎性、情感共鳴力、商業(yè)轉(zhuǎn)化潛力

25個(gè)渠道
一鍵對(duì)比試用API 限時(shí)免費(fèi)

#AI深度推理大模型API

對(duì)比大模型API的邏輯推理準(zhǔn)確性、分析深度、可視化建議合理性

10個(gè)渠道
一鍵對(duì)比試用API 限時(shí)免費(fèi)