
墨西哥支付方式:是什么?
想像下一代的互聯(lián)網(wǎng),用戶在瀏覽器網(wǎng)址框輸入的不再是網(wǎng)址,而是自然語(yǔ)言 prompt,需要的內(nèi)容就會(huì)實(shí)時(shí)生成渲染出來;下一代的操作系統(tǒng)每次打開,都會(huì)根據(jù)用戶近期行為和時(shí)間環(huán)境得到最適合的內(nèi)容。這里可能孕育著 AI 時(shí)代 Google 的機(jī)會(huì),成為賽博世界的新入口。
以上是我們看好 AI coding 領(lǐng)域投資機(jī)會(huì)的根本原因,接下來介紹對(duì) AI coding landscape 中興起幾類產(chǎn)品的分類坐標(biāo)系:
? Y 軸定義標(biāo)準(zhǔn):產(chǎn)品多大程度地需要 human in the loop,上方產(chǎn)品更能端到端完成任務(wù),下方更專注于 empower developer;
? X 軸定義標(biāo)準(zhǔn):產(chǎn)品的目標(biāo)用戶的開發(fā)能力有多強(qiáng)。左側(cè)產(chǎn)品偏向于服務(wù)專業(yè)開發(fā)者,右側(cè)偏向于服務(wù)沒有編程基礎(chǔ)的用戶。
3)Copilot for pro & Agent for citizen 是現(xiàn)在模型能力與產(chǎn)品需求相匹配的領(lǐng)域。
? 左下象限,Copilot for pro dev:
最近口碑優(yōu)秀的產(chǎn)品 Cursor、Codeium Windsurf 等基本都在這個(gè)象限。他們能在 early adopter 開發(fā)者圈子獲得了優(yōu)秀的口碑,對(duì)用戶需求的深入理解和 Claude Sonnet 3.5 出色的意圖理解能力在這里缺一不可。
他們要保持的增長(zhǎng)的關(guān)鍵問題是,優(yōu)秀的產(chǎn)品體驗(yàn)?zāi)艿玫?indie developer 的欣賞,但這對(duì)于 enterprise GTM 只是必要條件,而不是充分條件。從產(chǎn)品到企業(yè)信任,還有 privacy/compliance 等很多復(fù)雜需求。同時(shí)最近覺醒開始加速迭代的 Github Copilot 對(duì)他們的市場(chǎng)空間也會(huì)壓縮。
? 右上象限,Agent for citizen dev:
給普通人的 coding agent 產(chǎn)品形態(tài)還沒有固定:幾個(gè) coding 領(lǐng)域的前端deployment 和 web IDE 獨(dú)角獸推出了自己的產(chǎn)品,Vercel V0, bolt.new 能智能地生成前端 web app,Replit agent 可以跟用戶多輪交互生成基礎(chǔ)的軟件;而早期的創(chuàng)業(yè)公司則有更創(chuàng)新的產(chǎn)品形態(tài),websim 在模擬實(shí)時(shí)生成的 chrome,wordware 用類似 notion 的交互使用戶在其產(chǎn)品中創(chuàng)作軟件。
但這個(gè)象限的機(jī)會(huì)可能才剛剛開始,因?yàn)槟壳暗漠a(chǎn)品還拘泥于之前的思路。可以類比施樂實(shí)驗(yàn)室創(chuàng)新 GUI 之前的命令行時(shí)代,對(duì)大眾用戶的使用門檻很高,停留在 early adopter 圈子。
? 左上象限,Agent for pro dev:
要實(shí)現(xiàn)這一愿景,現(xiàn)在的模型能力還要繼續(xù)提升。歐美有>5家融資規(guī)模上億美金的公司在這個(gè)領(lǐng)域攻堅(jiān),因?yàn)?code token 的消耗量級(jí)很大,要解決的工程問題也很多。其中最關(guān)鍵的問題是企業(yè) codebase context 的問題:
一方面,如何從巨大的 codebase 中做精準(zhǔn)的 retrieval 是個(gè)難題,在科技大廠中也常常有老工程師離職之后之前的代碼項(xiàng)目難以理解的問題,AI 理論上能有更長(zhǎng)的 context window 但目前理解并搜索的精確度還不夠;另一方面,enterprise codebase 中包括了大量公司內(nèi)部的業(yè)務(wù)邏輯,需要專有數(shù)據(jù)微調(diào)、甚至 on-prem deployment。MS Stanley/Coca Cola 這樣的大型企業(yè) developer 數(shù)量是不比 Google、Meta 少的,而他們對(duì) compliance 和 privacy 的要求高于技術(shù)本身。
? 右下上限,copilot for citizen dev:
這一個(gè)領(lǐng)域已經(jīng)有比較成熟的解決方案,因此后文的公司 mapping 中不會(huì)出現(xiàn)這一象限。之前幾代 low-code/RPA 有不少成功的產(chǎn)品,也有 UIPath 等上市公司和 Retool 等獨(dú)角獸公司。但他們都停留在 copilot 階段,其抽象方式只能輔助一部分用戶固定的工作流。
反而 excel 成為了最好的 no-code 產(chǎn)品,幫助大部分知識(shí)工作者實(shí)現(xiàn)了很多科學(xué)計(jì)算和統(tǒng)計(jì)任務(wù)。這是一個(gè)有趣的歷史啟示,這一代 AI Coding 產(chǎn)品面對(duì)的 “Excel” 是 ChatGPT 這個(gè) 5 億 MAU 的產(chǎn)品,如何繞過他們的 user base 和最強(qiáng)模型是創(chuàng)業(yè)團(tuán)隊(duì)們要思考和保持迭代的問題。
根據(jù)以上 thesis,我們對(duì)整個(gè) AI 編程圖景下的創(chuàng)業(yè)公司進(jìn)行了 mapping:
? Copilot for pro:根據(jù)開發(fā)工作流可以分為 Coding、Testing、Code review 和 Code search。其中核心價(jià)值還是集中在入口級(jí)的 coding 部分。
??Agent for pro:這個(gè)領(lǐng)域有兩類公司,Coding agent 和 coding model 公司。他們之間最大的差異是是否從頭開發(fā)模型。前者是基于頂尖 LLM 之上去建立工作流和 agent,而 coding model 類公司則自己從頭開始訓(xùn)練 coding-specific 模型。其中并不看好后一類,因?yàn)樵?LLM 公司的主航道上。
? Agent for citizen:這個(gè)領(lǐng)域的公司目前還沒有明顯的收斂,我們可以分為三類。第一類是 task engine,為用戶完成任務(wù)實(shí)現(xiàn) Prototype 的 Task engine 類公司;第二類是前端網(wǎng)頁(yè)生成;第三類是 low-code 類使用“樂高”式組件搭建應(yīng)用的產(chǎn)品。最終大家的目標(biāo)可能都是 task engine,只是現(xiàn)在大家選擇了不同的路線 bet on。
? Coding 代表公司:Anysphere(Cursor), Codeium, Augment
Product
專注在編程體驗(yàn)的產(chǎn)品可以分為兩類:IDE 和 VSCode extension。兩者有各自的優(yōu)勢(shì):自己做 IDE 能有完整的產(chǎn)品自由度和用戶數(shù)據(jù)積累,做 VSCode Extension 則更加敏捷、用戶遷移成本比較低。
Cursor 團(tuán)隊(duì)在這里的選擇很聰明,通過 fork VSCode 獲得了兩個(gè)選擇各自的優(yōu)勢(shì)。Codeium 也在通過 Windsurf 也都在往 IDE 的方向切入,因?yàn)?IDE 還是更好的入口級(jí)產(chǎn)品,能自己積累數(shù)據(jù)、有更多 feature 修改的空間,這對(duì)于產(chǎn)品構(gòu)建自己的壁壘至關(guān)重要。
Cursor 在用戶體驗(yàn)上花了很多精力,做到“快”和 next action prediction。這樣用戶的開發(fā)過程就是不斷按 Tab,進(jìn)入很快得到反饋的正循環(huán)中(快=fun,進(jìn)入心流)。上個(gè)月他們收購(gòu) Supermaven,就是把產(chǎn)品體驗(yàn)中的“快”做到極致;這意味著短期內(nèi)的重點(diǎn)還在人與 AI 的同步協(xié)作,o1 這樣的異步交互暫時(shí)還不在產(chǎn)品主線上。
而 Codeium 團(tuán)隊(duì)從 VSCode extension 開始到 IDE,體現(xiàn)出了和 cursor 團(tuán)隊(duì)思路的區(qū)別。Cursor 更強(qiáng)調(diào)編程體驗(yàn)和對(duì)用戶下一步意圖的識(shí)別,Codeium 的新產(chǎn)品 Windsurf 更強(qiáng)調(diào)高自動(dòng)化。他們的 Chat 功能比 Cursor 做得更加完善,很多用戶不用 hands-on code 也能完成基礎(chǔ)的開發(fā)。
同時(shí),他們的產(chǎn)品還體現(xiàn)出了更強(qiáng)的對(duì)企業(yè)級(jí)需求更強(qiáng)的理解,支持 on-prem 專有模型和各種compliance協(xié)議。這里就要提到他們?cè)?GTM 策略上的巨大差異。
根據(jù) Sacra 最新報(bào)告 Cursor 產(chǎn)品 ARR 已經(jīng)達(dá)到 $65M,也就是大約30萬付費(fèi)用戶。由于 Cursor 的產(chǎn)品沒有對(duì)企業(yè)級(jí)codebase的重視,他們的核心用戶還是硅谷 indie hacker。那他們未來的關(guān)鍵 bet 是 indie hacker 是否能在所有開發(fā)者比例中變高:如果 AI 產(chǎn)品的開發(fā)范式下獨(dú)立開發(fā)者數(shù)量達(dá)到500萬,也就等于今天所有開發(fā)者的 10%,cursor 的市場(chǎng)空間才能達(dá)到十億美金。
而企業(yè)側(cè) BD 和開發(fā)者市場(chǎng)的增長(zhǎng)方式不一樣,Codeium 在企業(yè) GTM 簽訂單上的能力很強(qiáng)。因?yàn)槠髽I(yè)數(shù)據(jù) compliance 需求不是最順暢的產(chǎn)品體驗(yàn),而是在安全、合規(guī)等企業(yè)在意的方向有。在 Latent Space 的一篇專訪中 Anshul 提出了 enterprise infra native 的概念,強(qiáng)調(diào)了要做財(cái)富500強(qiáng)用戶,需要突破硅谷開發(fā)者圈子的mindset:
? 安全:需要支持多種部署選項(xiàng),比如 self-host 或混合部署;容器化部署(Docker、Kubernetes)是關(guān)鍵,需確保客戶環(huán)境的數(shù)據(jù)隔離。
? 合規(guī):企業(yè)對(duì) LLM 使用的訓(xùn)練數(shù)據(jù)有高度敏感性,需證明未使用受版權(quán)保護(hù)或未經(jīng)許可的數(shù)據(jù);數(shù)據(jù)清理和數(shù)據(jù)來源追蹤,確保合規(guī)性。
??個(gè)性化:數(shù)據(jù)質(zhì)量直接決定個(gè)性化效果,需要對(duì)數(shù)據(jù)的時(shí)效性和相關(guān)性進(jìn)行評(píng)估。,幫助企業(yè)通過 fine-tuning/RAG 寫出更高質(zhì)量的代碼。數(shù)據(jù)預(yù)處理和基于角色的訪問控制(RBAC)是關(guān)鍵,避免因信息整合導(dǎo)致數(shù)據(jù)泄露。
? ROI 分析:生成式 AI 的 ROI 難以量化,通過提供分團(tuán)隊(duì)的使用數(shù)據(jù),幫助客戶優(yōu)化使用效果、證明價(jià)值。
? 規(guī)模:企業(yè)環(huán)境復(fù)雜且規(guī)模龐大(如數(shù)萬代碼庫(kù)、數(shù)萬開發(fā)者),需解決大規(guī)模索引和延遲管理的問題。系統(tǒng)設(shè)計(jì)需在高用戶量、高數(shù)據(jù)量的情況下保持高效穩(wěn)定。
企業(yè)側(cè)的機(jī)會(huì)可能是更明確的低垂果實(shí),只是他們面對(duì)的競(jìng)爭(zhēng)是 Github Copilot 極強(qiáng)的分發(fā)渠道。面對(duì)競(jìng)爭(zhēng)時(shí),用 research 去解決 Github 可能做不好的地方是至關(guān)重要的。
Research
這些 coding 公司不能只看成應(yīng)用層產(chǎn)品公司,而是 research 和產(chǎn)品一體的公司。Cursor 官網(wǎng)稱自己為 applied resarch lab,Codeium 官網(wǎng)博客中寫了大量對(duì)微調(diào)/RAG 技術(shù)方案的思考,Augment 也在 Retrieval、RL 等方向上做了大量探索。
Augment 和 Codeium 更在乎的是企業(yè)級(jí)技術(shù)方案,尤其是 Github Copilot 目前解決不好的問題。例如 Augment 在解決的事在數(shù)萬個(gè)企業(yè)codebase 中怎么精準(zhǔn)地做好 retrieval 和交互理解。和企業(yè)文檔 RAG 遇到的難題類似,codebase retrieval 需要重新訓(xùn)練專用的 embedding model,對(duì)話、補(bǔ)全、跨文件生成需要的embedding 都不一樣。Codeium 還思考很多在企業(yè) on-prem/VPC 上部署專用 coding 模型的問題,來達(dá)到安全性和智能程度的平衡。
而對(duì)于 Cursor,強(qiáng) reasoning 能力下的異步協(xié)同是研究的核心方向,對(duì)應(yīng)到內(nèi)部項(xiàng)目 shadow workspace。shadow workspace 是 Cursor 為后臺(tái) coding agent 設(shè)計(jì)的開發(fā)空間,這個(gè)空間需要能看到 agent 修改引發(fā)的 lint 提示信息,并且和 IDE 背后的LSP協(xié)議進(jìn)行充分交互,但不去修改用戶原本的文件。AI 和用戶會(huì)一起根據(jù) shadow workspace 下的 Lint 反饋來決定是否進(jìn)行下一步的迭代。這個(gè)過程和 o1 inference time compute 類似。
? Testing 代表公司:QA Wolf, Momentic, Gru AI
Coding testing 是所有開發(fā)者必經(jīng)的工作流,來保證代碼的準(zhǔn)確性。其中有兩個(gè)常見常見:其一是 unit test,在錯(cuò)綜復(fù)雜的系統(tǒng)中,代碼被更新之后需要 unit test 來驗(yàn)證其可用性,減少其引發(fā)意外崩潰的概率;其二是前端或應(yīng)用開發(fā)中,需要對(duì) UI 每一個(gè)功能進(jìn)行交互測(cè)試。
測(cè)試任務(wù)和 codegen 的適配度也很高,因?yàn)椋浩鋵懙倪^程是高重復(fù)性高,且有規(guī)律可循的;而且這是人類工程師不太愿意工作的任務(wù),大部分團(tuán)隊(duì)的 unit test 的覆蓋率比較低,能側(cè)面說明這一點(diǎn)。
同時(shí) Cursor 團(tuán)隊(duì)在訪談中提到過 debug 對(duì) LLM 底座頗有難度,LLM 的訓(xùn)練方式不是去發(fā)現(xiàn)錯(cuò)誤,要讓 LLM 理解一個(gè)看起來不大錯(cuò)誤的后續(xù)重大影響是比較難的。因此這里能有獨(dú)立創(chuàng)業(yè)公司的機(jī)會(huì)。
這個(gè)領(lǐng)域的代表公司中:QA Wolf 是 LLM 出現(xiàn)之前就有的公司,以 Rule-based 的方法就能實(shí)現(xiàn)很多 test case;Momentic 是最近 YC 和 AI Grant 中涌現(xiàn)的項(xiàng)目,更偏向人和 AI 協(xié)作對(duì)視覺產(chǎn)品 UI 進(jìn)行測(cè)試;Gru AI 則是為 Unit Test 場(chǎng)景設(shè)計(jì)專用的 agent 來端到端企業(yè)中的測(cè)試需求。
? Code Review & Refactor 代表公司:CodeRabbit
Code Review & Refactor 是開發(fā)者工作中比較重要的質(zhì)量保障工作,無論是企業(yè)還是獨(dú)立開發(fā)者都需要花時(shí)間 review 組織內(nèi)外部的 PR request。根據(jù) Techcrunch,50% 的 enterprise developer 每周要花5個(gè)小時(shí)進(jìn)行 code review相關(guān)工作。
這里的代表公司 CodeRabbit 不到一年的時(shí)間內(nèi)就實(shí)現(xiàn)了 $100M+ ARR,是GitHub 和 GitLab 上安裝次數(shù)最多的 AI app,已經(jīng)review PR 300萬條以上,說明 LLM-native 產(chǎn)品在這個(gè)領(lǐng)域已經(jīng)能提供不錯(cuò)的服務(wù)。
同時(shí)還有更大型的 CI/CD 任務(wù)可以被歸類為 code refactoring,對(duì)代碼項(xiàng)目進(jìn)行優(yōu)化和重構(gòu),來解決組織中之前遺留的技術(shù)債,甚至可能對(duì)技術(shù)架構(gòu)需要進(jìn)行重構(gòu)和遷移,那就是 Code Migration。這樣的需求也是非常繁重、人類工程師不太愿意完成的。因此,這成了我們接下來介紹的 Coding agent 公司最早得到 PMF 的場(chǎng)景。
Agent for pro
? Coding agent 代表公司:Cognition (Devin), Factory
Coding agent 公司的平均融資規(guī)模是最大的,因?yàn)檫@些公司的目標(biāo)是實(shí)現(xiàn) end-to-end 替代人類開發(fā)者,實(shí)現(xiàn)這個(gè)過程的工程量大、消耗 code tokens 數(shù)量大。這個(gè)領(lǐng)域的現(xiàn)狀可能有兩個(gè)要解決的問題:
1) 技術(shù)上模型底層推理能力不夠。在企業(yè)大 codebase 中去完整的處理問題需要很強(qiáng)的推理能力,去理解用戶和codebase 兩端的 context,然后將任務(wù)拆解為多個(gè)解決步驟。這樣的 long-context + long-horizon reasoning 能力才能真正解決企業(yè)側(cè)復(fù)雜的工程問題。
2) 產(chǎn)品上,UI/UX 層需要與人類協(xié)作方式的創(chuàng)新。既然模型的能力還沒達(dá)到完全可用,如何去 involve human in the loop 到協(xié)作中就是一個(gè)比較難的問題:模型遇到難的問題時(shí)是選擇 inference-time compute 做搜索還是交給用戶去介入給更多的指導(dǎo)和context?如果這個(gè)問題解決得不好,呈現(xiàn)出的效果可能是,AI 自己工作了 12 個(gè)小時(shí)之后發(fā)現(xiàn)束手無策,交給用戶也很難在AI 的基礎(chǔ)上進(jìn)行修正。
由于以上問題,我們推測(cè)現(xiàn)在實(shí)際能有 PMF 的場(chǎng)景會(huì)是 code migration,code refactoring 和 PR commit 等任務(wù)。這些任務(wù)對(duì)于開發(fā)者來說往往是 toil 也就是不愿意做的事情,開發(fā)者專注在這些任務(wù)上以后可以把精力集中在別的更有創(chuàng)造力的領(lǐng)域。因此目前 coding agent 現(xiàn)階段做得更多是從 1 到 100 的事情,還沒有到從 0到 1 的任務(wù)上。我們看好 coding agent 在未來 2 年內(nèi)會(huì)逐漸承擔(dān)更多的責(zé)任,不過那需要底層模型的能力和上層 agent 框架的共同進(jìn)步。
定價(jià)問題也很值得思考:傳統(tǒng) dev tool 的定價(jià)一般是按使用者數(shù)量 seat-based 付費(fèi),對(duì)于coding agent 而言 consumption-based 付費(fèi)可能是更合理的定價(jià),優(yōu)秀的、完成大量任務(wù)的 coding agent 價(jià)格可能值得和 junior developer 在同一個(gè)數(shù)量級(jí)。
? Coding Model 代表公司:Poolside、Magic
Coding 領(lǐng)域?qū)?a href="http://www.dlbhg.com/wiki/what-is-a-large-model-understand-the-basic-concepts-of-ai/">模型能力的要求是不完全一致的,比如 code tokenizer 對(duì)代碼中的變量、符號(hào)、函數(shù)名都要做專門的切分,以及主流 LLM 的訓(xùn)練是以文本生成為主要目標(biāo)函數(shù),代碼能力看起來是其智能的副產(chǎn)品。因此 Coding model 領(lǐng)域開始出現(xiàn)一些獨(dú)立公司:
? Magic 強(qiáng)調(diào)特別長(zhǎng)的 context window,能把企業(yè)中復(fù)雜的 codebase 完整讀進(jìn)來解決問題,盡量避免 retrieval;
? Poolside 強(qiáng)調(diào) RL from machine feedback,能把 Git history 中復(fù)雜的工程鏈條完整解決。
不過這一領(lǐng)域的公司在 OpenAI、Anthropic 的主航道上,考慮到 Coding 能力是模型推理能力最好的proxy,這兩家公司的模型一定會(huì)在 LLM + RL 的范式下在 coding 能力上持續(xù)進(jìn)步。
Autopilot for citizen
? Task engine 代表產(chǎn)品:Replit、Websim、Wordware
Task engine 對(duì)應(yīng)的是 search engine,用戶得到的不再是基于搜索關(guān)鍵詞的網(wǎng)頁(yè),而是基于用戶需求生成的軟件。我們定義為 task engine 是希望弱化軟件和 code 這些詞帶來的高門檻意味,coding 能力帶來的 killer app 應(yīng)該是大眾用戶都有意愿和能力去使用的。
Anthropic Artifact 和 OpenAI Canvas 在一定層面上也是希望能實(shí)現(xiàn)這個(gè)目標(biāo),但其產(chǎn)品形態(tài)并不是很易用,加上用戶對(duì)主產(chǎn)品的預(yù)期還是 chatbot。因此現(xiàn)在的 task engine 還在命令行時(shí)代,需要一個(gè) GUI 級(jí)別的產(chǎn)品創(chuàng)新來讓更多用戶能理解使用。
目前這類產(chǎn)品的形態(tài)其實(shí)還有很大分歧:
??Replit agent:?cloud IDE for coding agent。產(chǎn)品使用 chat 多輪對(duì)話交互,每一次執(zhí)行 action 都是漸進(jìn)式的,遇到問題會(huì)向用戶提問來補(bǔ)足context、厘清需求,對(duì)話過程類似開發(fā)者和產(chǎn)品經(jīng)理對(duì)需求的過程。這種產(chǎn)品設(shè)計(jì)思路用 alignment 解決了模型多步執(zhí)行時(shí)的可靠性問題,但也要求用戶對(duì)自己的需求想得比較清楚。
??Wordware:?Notion for LLM app。產(chǎn)品完成度高,使用體驗(yàn)比較像創(chuàng)作內(nèi)容,通過 Twitter 嘲諷 bot 找到了很好的viral 增長(zhǎng)第一槍。用 Twitter 作為增長(zhǎng)起點(diǎn)的方式讓人想起了去年的 Perplexity。成為增長(zhǎng)最快的 ProductHunt 產(chǎn)品之后,流量開始快速下降,高度依賴頭部流量產(chǎn)品是 Wordware 現(xiàn)在的挑戰(zhàn)。?
? Websim: 用類似 Google Chrome 的簡(jiǎn)陋 UI,打造了一個(gè)用戶能同時(shí)創(chuàng)作和消費(fèi) web app 的產(chǎn)品。這個(gè)產(chǎn)品的想象空間很大,用戶可以在上面基于用戶的 template 繼續(xù)生成和修改,有點(diǎn)像 Canva 的模板化思路。而且用戶在 Websim 上打造的網(wǎng)站每一個(gè)超鏈接可以繼續(xù)點(diǎn)擊并深入生成新的網(wǎng)站。不過他們的產(chǎn)品設(shè)計(jì)細(xì)節(jié)還欠打磨,有點(diǎn)類似 C.ai 有一個(gè)很好的框架但在產(chǎn)品上不夠極致。
? 前端生成代表公司:Vercel (V0)、Stackblitz (Bolt.new)
這一領(lǐng)域的公司之前就在前端框架和部署領(lǐng)域有比較深的積累。例如 Vercel 是 Next.js 框架的發(fā)明者,主要業(yè)務(wù)是前端網(wǎng)站的部署,ARR 也已經(jīng)達(dá)到 1 億美金以上,我們之前有過詳細(xì)的研究。他們的 Vercel V0 產(chǎn)品一直在進(jìn)步,無論是審美風(fēng)格還是對(duì)話修改上的體驗(yàn)都比剛發(fā)布時(shí)優(yōu)秀很多。另一個(gè)很火的產(chǎn)品是 bolt.new,也能通過一句話把產(chǎn)品需求變成不錯(cuò)的 web app 產(chǎn)品。其進(jìn)步速度更快,同樣的prompt 每一兩周都能看到其生成質(zhì)量的進(jìn)步。
這類產(chǎn)品的效果已經(jīng)接近可用了,不過實(shí)際持續(xù)使用的時(shí)候會(huì)遇到一些問題。web app 生成出來的 demo 十分優(yōu)秀,但由于其技術(shù)棧比較雜,生成的產(chǎn)品真正開始有規(guī)模之后很難維護(hù)和管理。因此前端生成的未來 use case 很可能是 desposable application,這個(gè)網(wǎng)頁(yè)的生成就是為了服務(wù)某個(gè)臨時(shí)、長(zhǎng)尾的需求,并不用為更大的群體、更長(zhǎng)的時(shí)間去維護(hù)。
前端是開發(fā)中相對(duì)好上手的領(lǐng)域,因此之前每一代 Low-code/No-code 都會(huì)講前端民主化的故事,誕生了 WordPress、Wix、Spacesquare 甚至 Shopify 這樣的公司。整個(gè)市場(chǎng)很大,但需求比較零碎,市場(chǎng)頭部集中度不高。AI 前端生成現(xiàn)在看起來很有前景,但他們是否能抓住大量增量需求,甚至代替過去的存量需求呢?這直接決定了其市場(chǎng)規(guī)模的上限。
1)Coding 能力的民主化?不,是軟件工程的民主化。
技術(shù)會(huì)帶來一個(gè)領(lǐng)域的民主化,這是很多領(lǐng)域都發(fā)生過的故事,例如 Canva 成為了設(shè)計(jì)師民主化的一站式模版和設(shè)計(jì)平臺(tái)。而開發(fā)領(lǐng)域是否會(huì)有這樣的民主化故事呢?
我們認(rèn)為 Coding 能力不會(huì)發(fā)生民主化,但軟件工程會(huì)。這意味著軟件的制造成本會(huì)隨著 AI coding 帶來大幅下降,但用戶不一定需要理解 code 編程是如何操作并執(zhí)行的,只需要明白 high level 的運(yùn)行邏輯即刻。也就是說,用戶們不需要是開發(fā)者,但需要是自己需求的產(chǎn)品經(jīng)理
2)UI/UX:同步與異步,GUI 時(shí)刻的到來。
未來的開發(fā)體驗(yàn)可能由同步和異步組成:同步的部分,開發(fā)者一邊寫代碼,AI 一邊在后臺(tái)同步做 code testing/review/optimization;異步的部分,o1范式下的 inference-time compute 能把 coding 任務(wù)拆解為多個(gè)子任務(wù),推理出最合適的解決方案并自己驗(yàn)證。
而未來更廣義的 AI coding 也是如此,很多軟件都是實(shí)時(shí)根據(jù) context 來實(shí)時(shí)生成,而真正復(fù)雜的任務(wù)則不需要交互,AI 能異步的完成并通過郵件等方式向用戶同步。
現(xiàn)在的產(chǎn)品交互使用門檻還偏高,類似 GUI 到來前的命令行時(shí)刻。等待新交互到來時(shí),AI 應(yīng)用的空間會(huì)被打開,coding 領(lǐng)域可能是最先驗(yàn)證和感知到的。
本文章轉(zhuǎn)載微信公眾號(hào)@海外獨(dú)角獸
對(duì)比大模型API的內(nèi)容創(chuàng)意新穎性、情感共鳴力、商業(yè)轉(zhuǎn)化潛力
一鍵對(duì)比試用API 限時(shí)免費(fèi)