
墨西哥支付方式:是什么?
訓練靠后,推理向前,ASIC 敘事逐漸減弱,NV 的算力份額和領導者地位依然穩固,市值將達到 4 萬億
以 o1 為起點,由于模型推理能力的增強,以及軟件公司用 LLM 開發新產品或進行自我改造的積極性提升,推理需求指數級增長讓今年下半年以來 CSP ASIC 顯著受益,CSP 離下游需要推理的客戶群體更近,Amazon、Google、微軟等大廠都在通過自有芯片研減少對 GPU 的依賴。
2025 年 Inference 作為硬件板塊的核心命題不會改變,考慮到整個算力市場需求比預期要更大,CSP ASIC 敘事會在明年逐漸走弱,而 NVDA 依靠 GB200 在 TCO/性能仍會在算力市場維持自身的領導者地位,相比之下 AMD 丟失的市場份額可能會更明顯。
O 系列開始,inference time compute 的思路讓 post training 的重要性提高了很多,可提升的空間和消耗的算力層面都可能比 pretrain 更重要。
在這個趨勢下,post-training 和 pre-training 的界線會越來越模糊,post-training 會消耗更大的算力、解鎖更多能力,pre-training 會漸進式地用 RL 來漸近找到更好的 data recipe。類似從 AlphaGo 到 AlphaZero 那樣,模型能夠逐漸離開一部分人類數據,用合成數據來得到更多數據分布外的高質量數據,解鎖更高天花板的智能。
改寫、編排現有的數據雖然能提升數據質量,但不能提供增量數據和新知識。如何規模化地獲取合成數據是技術上重要的難點,也是我們期待的突破點。去年這個突破沒有實現,我們預測今年能夠取得進展,因為 pre train 的數據瓶頸今年愈發緊迫。
o3 驗證了 reasoning scaling law,但商業化落地遇到瓶頸
o3 在 ARC-AGI 和 Frontier Math 涌現式的能力突破定義了真正優秀的推理能力,這讓我們對 o 系列的成長上限有更強的信心:o3 帶來了 reasoning scaling law,強推理能力正是解鎖 agent 最必要的能力。2025 年,模型每 3 個月就會實現過去 1 年的能力進步。
但 o1 的商業化確定性和前幾代模型相比要更低,因為強推理并不是大眾用戶的需求,只有少數用戶對這樣的高生產力、復雜推理問題有需求。因此現在 ChatGPT 產品中 o1 的使用率也不到 5%。同時 o1 query 的定價也很貴,所以需要 200 美金甚至 2000 美金/月的價格來支持更大的 inference time compute 需求。
Chatbot 競爭翻篇,
開始全新 AI產品形態競爭
Chatbot 的競爭在 2024 年結束了,2025 年 各模型公司要在全新的產品形態上競賽。Chatbot 仍將是包容性最強,用戶受眾最廣的前端交互,但 computer use、coding agent、artifacts 等更復雜,更跨軟件,更能捕捉用戶行為數據的交互會成為新的重點。
Memory 和 Online learning 問題在 25 年得到解決,LLM 更加主動和個性化
和推薦算法比,LLM 的缺陷是不能實時更新 weights,所以模型無法千人千面。Memory 是 AI labs 和 Agent 公司花了很多精力解決的問題,我們認為 Memory 會在 2025 年有不錯的解決方案,onling learning 也能有一定突破,讓 LLM 和 Agent 真的做到更主動,更懂用戶。
多模態智能得到突破,visual reasoning 涌現,用戶和 AI 交互可能性被拓寬,出現AI+IP 爆款
過去兩年多模態智能能力發展不如語言,但 2025 年多模態智能會得到更多投入。視覺推理和 Scaling Law 的涌現現象成為重要研究方向。尤其是 Google、Meta、Tesla 等大企業,有海量視覺數據,有處理視覺數據的完整 infra,也有更明確的多模態應用場景,相比 AI labs 會更重視多模態的研究發展。
雖然我們在 2024 年的預測中提到類 Character.ai 賽道會收斂在今年得到驗證,但 Character.ai 代表的底層需求不變。經典 IP 長盛不衰、Jellycat 的爆火本質上是“陪伴”。AI 時代的 Her 不是 chatbot,更有可能從經典 IP 嫁接而生:AI,尤其是多模態智能會讓人類和已有 IP 的互動變得更真實、絲滑,例如迪士尼、任天堂等相關公司也會利用多模態推動新應用和經典 IP 喚新。
ChatGPT 和 Perplexity 跑通廣告變現模式,廣告超越訂閱模式成為主流
因為面向生產力場景,LLM startups 一開始通過訂閱模式嘗試商業化,但訂閱的增長曲線有限:ChatGPT 的 MAU 預計已經超過 5 億,年收入約 40 億美金,平均一個月活用戶只有~8 美元/年收入,而 Google、Meta 每個月活用戶 ARPU 都價值100美金起。訂閱無法支撐 AI 超級應用,廣告還是主流商業化方向。
從去年下半年開始 perplexity 和 OpenAI 都已經透露出試水廣告,通過問答的形式直連商品、服務搜索,進一步有可能重組視頻、電商、工作、酒旅、住房等供應鏈。
自動駕駛到達商業化拐點:Waymo 開始蠶食 Uber 市場份額,Waymo 可能會在 2025 年 IPO
Waymo 在 2024 年 8 月占 SF 網約車份額為 5%,到 11 月訂單金額市占率快速上升超過20%,且出現一定網絡效應,到 12月初 Waymo 在全美已經實現了17.5 萬次/周的付費出行。隨著監管放松 Waymo 的規模效應還會加速。
AI 領域 M&A 活躍:AI 應用、Coding 領域出現大的收購,中小 GPU 云會被整合
2025 年,AI 領域的投資并購會繼續活躍,不過主題從大廠收購 foundation model 公司轉變為中大型公司收購 AI native 應用,帶來 M&A 的有 4 個角度的因素:
? 硬件領域,2025 年 NV B 系列正式投入使用后,GPU 云領域的成本和價格競爭會進一步加劇,很多中小 GPU 云會破產,對于頭部公司而言是低價收購資產的好時機;
? SaaS 領域過去圍繞 Vertial SaaS 的 buy-and-run 會在 vertical AI 上重演,尤其 Sales、HR、Legal、Healthcare 等垂直領域會出現 AI start-ups 被大公司收購的情況;
??AI 搜索、AI Coding、視頻生成等領域作為 LLM 領域競爭的主線,大公司尤為重視,與此同時 Starups 估值增長過快,可能會先出現公司業務發展跟不上估值 hype,在這種情況下,big-techs 進行收并購可能帶來 win-win ;
? 頭部 Startups 為強化自身競爭力圍繞技術棧、場景進行收購。
電力短缺持續,核電重啟是明確趨勢 ,有機會出現 10x 股公司
不僅美國本土,超大計算集群、再工業化帶來的電力短缺還在持續,全球范圍內電力需求到 2050 年會增加 ?1/3 到 3/4。核電的新建或重啟是全球范圍內確定性趨勢,但供給端還沒有做好相關準備,原料短缺、地緣政治的擾動等因素給整個產業鏈上的資產帶來價值稀缺性。
AI for science 發展迅速,各個科學領域有自己的 foundation model
生命科學、材料、氣象和工業仿真等各個科學領域已經涌現出各自的 foundation model。與 LLM 不同,AI4S 領域不存在數據墻問題,在實踐中還可以通過第一性原理模擬生成無限的高質量合成數據,這一特性會讓 AI4S 各個領域的 foundation model 涌現,且模型能力迭代速度極快。
AI 技術紅利大部分流入大公司,
Mega 9 強者恒強
Mega 9 公司掌握著 AI 的關鍵資產:云、算力、分發渠道。任何企業、個人買單 AI 的價值,他們都有機會“收稅”。隨著 AI 在 2025 年真正走向 massive adoption ,這些公司可以持續躺在 AI 富礦上賺取收益。
美股 2025 Q1 業績后因為 AI 進展緩慢大調整,但又會在年底前破新高
以 Agentforce 為代表的 SaaS 公司 AI 產品的表現推高了美股對于 AI 應用層的 hype,雖然企業側投入和推廣 AI 產品相較于 1 年前更加激進,但作為投資者需要對企業 AI 業務落地和盈利情況保持理性和警惕,一旦實際業績兌現略低于市場對 AI 故事的預期,就會出現大的回調,我們預計 2025 H1 大概率會出現這一情況。到 2025H2,隨著 LLM 能力提升,尤其是 agent 在 tool use 和長距離復雜任務上的進步,AI 會重新帶來股價新高,重演 2024 H2 的情況。
本文章轉載微信公眾號@海外獨角獸