
墨西哥支付方式:是什么?
訓(xùn)練靠后,推理向前,ASIC 敘事逐漸減弱,NV 的算力份額和領(lǐng)導(dǎo)者地位依然穩(wěn)固,市值將達(dá)到 4 萬億
以 o1 為起點(diǎn),由于模型推理能力的增強(qiáng),以及軟件公司用 LLM 開發(fā)新產(chǎn)品或進(jìn)行自我改造的積極性提升,推理需求指數(shù)級(jí)增長讓今年下半年以來 CSP ASIC 顯著受益,CSP 離下游需要推理的客戶群體更近,Amazon、Google、微軟等大廠都在通過自有芯片研減少對(duì) GPU 的依賴。
2025 年 Inference 作為硬件板塊的核心命題不會(huì)改變,考慮到整個(gè)算力市場(chǎng)需求比預(yù)期要更大,CSP ASIC 敘事會(huì)在明年逐漸走弱,而 NVDA 依靠 GB200 在 TCO/性能仍會(huì)在算力市場(chǎng)維持自身的領(lǐng)導(dǎo)者地位,相比之下 AMD 丟失的市場(chǎng)份額可能會(huì)更明顯。
O 系列開始,inference time compute 的思路讓 post training 的重要性提高了很多,可提升的空間和消耗的算力層面都可能比 pretrain 更重要。
在這個(gè)趨勢(shì)下,post-training 和 pre-training 的界線會(huì)越來越模糊,post-training 會(huì)消耗更大的算力、解鎖更多能力,pre-training 會(huì)漸進(jìn)式地用 RL 來漸近找到更好的 data recipe。類似從 AlphaGo 到 AlphaZero 那樣,模型能夠逐漸離開一部分人類數(shù)據(jù),用合成數(shù)據(jù)來得到更多數(shù)據(jù)分布外的高質(zhì)量數(shù)據(jù),解鎖更高天花板的智能。
改寫、編排現(xiàn)有的數(shù)據(jù)雖然能提升數(shù)據(jù)質(zhì)量,但不能提供增量數(shù)據(jù)和新知識(shí)。如何規(guī)模化地獲取合成數(shù)據(jù)是技術(shù)上重要的難點(diǎn),也是我們期待的突破點(diǎn)。去年這個(gè)突破沒有實(shí)現(xiàn),我們預(yù)測(cè)今年能夠取得進(jìn)展,因?yàn)?pre train 的數(shù)據(jù)瓶頸今年愈發(fā)緊迫。
o3 驗(yàn)證了 reasoning scaling law,但商業(yè)化落地遇到瓶頸
o3 在 ARC-AGI 和 Frontier Math 涌現(xiàn)式的能力突破定義了真正優(yōu)秀的推理能力,這讓我們對(duì) o 系列的成長上限有更強(qiáng)的信心:o3 帶來了 reasoning scaling law,強(qiáng)推理能力正是解鎖 agent 最必要的能力。2025 年,模型每 3 個(gè)月就會(huì)實(shí)現(xiàn)過去 1 年的能力進(jìn)步。
但 o1 的商業(yè)化確定性和前幾代模型相比要更低,因?yàn)閺?qiáng)推理并不是大眾用戶的需求,只有少數(shù)用戶對(duì)這樣的高生產(chǎn)力、復(fù)雜推理問題有需求。因此現(xiàn)在 ChatGPT 產(chǎn)品中 o1 的使用率也不到 5%。同時(shí) o1 query 的定價(jià)也很貴,所以需要 200 美金甚至 2000 美金/月的價(jià)格來支持更大的 inference time compute 需求。
Chatbot 競(jìng)爭翻篇,
開始全新 AI產(chǎn)品形態(tài)競(jìng)爭
Chatbot 的競(jìng)爭在 2024 年結(jié)束了,2025 年 各模型公司要在全新的產(chǎn)品形態(tài)上競(jìng)賽。Chatbot 仍將是包容性最強(qiáng),用戶受眾最廣的前端交互,但 computer use、coding agent、artifacts 等更復(fù)雜,更跨軟件,更能捕捉用戶行為數(shù)據(jù)的交互會(huì)成為新的重點(diǎn)。
Memory 和 Online learning 問題在 25 年得到解決,LLM 更加主動(dòng)和個(gè)性化
和推薦算法比,LLM 的缺陷是不能實(shí)時(shí)更新 weights,所以模型無法千人千面。Memory 是 AI labs 和 Agent 公司花了很多精力解決的問題,我們認(rèn)為 Memory 會(huì)在 2025 年有不錯(cuò)的解決方案,onling learning 也能有一定突破,讓 LLM 和 Agent 真的做到更主動(dòng),更懂用戶。
多模態(tài)智能得到突破,visual reasoning 涌現(xiàn),用戶和 AI 交互可能性被拓寬,出現(xiàn)AI+IP 爆款
過去兩年多模態(tài)智能能力發(fā)展不如語言,但 2025 年多模態(tài)智能會(huì)得到更多投入。視覺推理和 Scaling Law 的涌現(xiàn)現(xiàn)象成為重要研究方向。尤其是 Google、Meta、Tesla 等大企業(yè),有海量視覺數(shù)據(jù),有處理視覺數(shù)據(jù)的完整 infra,也有更明確的多模態(tài)應(yīng)用場(chǎng)景,相比 AI labs 會(huì)更重視多模態(tài)的研究發(fā)展。
雖然我們?cè)?2024 年的預(yù)測(cè)中提到類 Character.ai 賽道會(huì)收斂在今年得到驗(yàn)證,但 Character.ai 代表的底層需求不變。經(jīng)典 IP 長盛不衰、Jellycat 的爆火本質(zhì)上是“陪伴”。AI 時(shí)代的 Her 不是 chatbot,更有可能從經(jīng)典 IP 嫁接而生:AI,尤其是多模態(tài)智能會(huì)讓人類和已有 IP 的互動(dòng)變得更真實(shí)、絲滑,例如迪士尼、任天堂等相關(guān)公司也會(huì)利用多模態(tài)推動(dòng)新應(yīng)用和經(jīng)典 IP 喚新。
ChatGPT 和 Perplexity 跑通廣告變現(xiàn)模式,廣告超越訂閱模式成為主流
因?yàn)槊嫦蛏a(chǎn)力場(chǎng)景,LLM startups 一開始通過訂閱模式嘗試商業(yè)化,但訂閱的增長曲線有限:ChatGPT 的 MAU 預(yù)計(jì)已經(jīng)超過 5 億,年收入約 40 億美金,平均一個(gè)月活用戶只有~8 美元/年收入,而 Google、Meta 每個(gè)月活用戶 ARPU 都價(jià)值100美金起。訂閱無法支撐 AI 超級(jí)應(yīng)用,廣告還是主流商業(yè)化方向。
從去年下半年開始 perplexity 和 OpenAI 都已經(jīng)透露出試水廣告,通過問答的形式直連商品、服務(wù)搜索,進(jìn)一步有可能重組視頻、電商、工作、酒旅、住房等供應(yīng)鏈。
自動(dòng)駕駛到達(dá)商業(yè)化拐點(diǎn):Waymo 開始蠶食 Uber 市場(chǎng)份額,Waymo 可能會(huì)在 2025 年 IPO
Waymo 在 2024 年 8 月占 SF 網(wǎng)約車份額為 5%,到 11 月訂單金額市占率快速上升超過20%,且出現(xiàn)一定網(wǎng)絡(luò)效應(yīng),到 12月初 Waymo 在全美已經(jīng)實(shí)現(xiàn)了17.5 萬次/周的付費(fèi)出行。隨著監(jiān)管放松 Waymo 的規(guī)模效應(yīng)還會(huì)加速。
AI 領(lǐng)域 M&A 活躍:AI 應(yīng)用、Coding 領(lǐng)域出現(xiàn)大的收購,中小 GPU 云會(huì)被整合
2025 年,AI 領(lǐng)域的投資并購會(huì)繼續(xù)活躍,不過主題從大廠收購 foundation model 公司轉(zhuǎn)變?yōu)橹写笮凸臼召?AI native 應(yīng)用,帶來 M&A 的有 4 個(gè)角度的因素:
? 硬件領(lǐng)域,2025 年 NV B 系列正式投入使用后,GPU 云領(lǐng)域的成本和價(jià)格競(jìng)爭會(huì)進(jìn)一步加劇,很多中小 GPU 云會(huì)破產(chǎn),對(duì)于頭部公司而言是低價(jià)收購資產(chǎn)的好時(shí)機(jī);
? SaaS 領(lǐng)域過去圍繞 Vertial SaaS 的 buy-and-run 會(huì)在 vertical AI 上重演,尤其 Sales、HR、Legal、Healthcare 等垂直領(lǐng)域會(huì)出現(xiàn) AI start-ups 被大公司收購的情況;
??AI 搜索、AI Coding、視頻生成等領(lǐng)域作為 LLM 領(lǐng)域競(jìng)爭的主線,大公司尤為重視,與此同時(shí) Starups 估值增長過快,可能會(huì)先出現(xiàn)公司業(yè)務(wù)發(fā)展跟不上估值 hype,在這種情況下,big-techs 進(jìn)行收并購可能帶來 win-win ;
? 頭部 Startups 為強(qiáng)化自身競(jìng)爭力圍繞技術(shù)棧、場(chǎng)景進(jìn)行收購。
電力短缺持續(xù),核電重啟是明確趨勢(shì) ,有機(jī)會(huì)出現(xiàn) 10x 股公司
不僅美國本土,超大計(jì)算集群、再工業(yè)化帶來的電力短缺還在持續(xù),全球范圍內(nèi)電力需求到 2050 年會(huì)增加 ?1/3 到 3/4。核電的新建或重啟是全球范圍內(nèi)確定性趨勢(shì),但供給端還沒有做好相關(guān)準(zhǔn)備,原料短缺、地緣政治的擾動(dòng)等因素給整個(gè)產(chǎn)業(yè)鏈上的資產(chǎn)帶來價(jià)值稀缺性。
AI for science 發(fā)展迅速,各個(gè)科學(xué)領(lǐng)域有自己的 foundation model
生命科學(xué)、材料、氣象和工業(yè)仿真等各個(gè)科學(xué)領(lǐng)域已經(jīng)涌現(xiàn)出各自的 foundation model。與 LLM 不同,AI4S 領(lǐng)域不存在數(shù)據(jù)墻問題,在實(shí)踐中還可以通過第一性原理模擬生成無限的高質(zhì)量合成數(shù)據(jù),這一特性會(huì)讓 AI4S 各個(gè)領(lǐng)域的 foundation model 涌現(xiàn),且模型能力迭代速度極快。
AI 技術(shù)紅利大部分流入大公司,
Mega 9 強(qiáng)者恒強(qiáng)
Mega 9 公司掌握著 AI 的關(guān)鍵資產(chǎn):云、算力、分發(fā)渠道。任何企業(yè)、個(gè)人買單 AI 的價(jià)值,他們都有機(jī)會(huì)“收稅”。隨著 AI 在 2025 年真正走向 massive adoption ,這些公司可以持續(xù)躺在 AI 富礦上賺取收益。
美股 2025 Q1 業(yè)績后因?yàn)?AI 進(jìn)展緩慢大調(diào)整,但又會(huì)在年底前破新高
以 Agentforce 為代表的 SaaS 公司 AI 產(chǎn)品的表現(xiàn)推高了美股對(duì)于 AI 應(yīng)用層的 hype,雖然企業(yè)側(cè)投入和推廣 AI 產(chǎn)品相較于 1 年前更加激進(jìn),但作為投資者需要對(duì)企業(yè) AI 業(yè)務(wù)落地和盈利情況保持理性和警惕,一旦實(shí)際業(yè)績兌現(xiàn)略低于市場(chǎng)對(duì) AI 故事的預(yù)期,就會(huì)出現(xiàn)大的回調(diào),我們預(yù)計(jì) 2025 H1 大概率會(huì)出現(xiàn)這一情況。到 2025H2,隨著 LLM 能力提升,尤其是 agent 在 tool use 和長距離復(fù)雜任務(wù)上的進(jìn)步,AI 會(huì)重新帶來股價(jià)新高,重演 2024 H2 的情況。
本文章轉(zhuǎn)載微信公眾號(hào)@海外獨(dú)角獸
對(duì)比大模型API的內(nèi)容創(chuàng)意新穎性、情感共鳴力、商業(yè)轉(zhuǎn)化潛力
一鍵對(duì)比試用API 限時(shí)免費(fèi)