
大模型上下文協議與Spring開發集成篇——mcp-spring-webmvc原理
Product – Led AI, Greylock
? 模型能力和對長尾角色的數據覆蓋直接決定了用戶聊天體驗,character ai 和競品相比有明顯更高對話交互質量和智能水平,可以進行更貼近角色的聊天。
? 模型優化能力和 inference cost 直接決定serving用戶的成本和效率,根據歷史融資量和訓練模型的效率,我們推測 character ai 的 inference cost 比 Chatgpt 小兩個量級,可以在有限 GPU 資源下支持更大的用戶規模。
? 更強的記憶和個性化能力,團隊從模型架構層面對記憶進行優化,還沒達到最理想水平,但我們傾向于認為能夠比其他團隊做得更好。活躍用戶量和用戶數據積累能在未來提高個性化能力。
角色扮演和情感陪伴是第一步,個性化的AI 雖然被很多人提起,但Character ai 具有一定的平臺先發優勢,能夠獲取用戶個性化的query分布,以獲取模型訓練方向和產品設計方向的反饋。團隊同時在積極研發多模態,并很快會上線具有網絡效應的新功能。如果character ai 實現這個愿景,有機會成為全民級應用。
C.AI 是很多東西:
1. 是一個 foundation model 和應用一體化的killer app。
2. 是利用 LLM 和所有人類故事IP作為創作原料和創作引擎,leverage用戶對IP幻想和二次創作的多樣化需求,搭建的一個聊天和游戲互動平臺。
3. 是一個大型角色扮演、fantasy游樂場。用戶去電影院看漫威,去漫展cosplay,小朋友去迪士尼看公主,青少年在網上語C,畫同人寫同人,游戲用戶玩RPG游戲,所追求的都是基于某個故事和場景設定,延伸出的fantasy需求。以前,創作和消費的需求是分開的,劇情是靜態的,而現在LLM 第一次讓邊消費邊創作、劇情無限延伸無限可能、實時互動實時改變的消費體驗成為現實。
4. 是一部分用戶的療愈場所,根據用戶評論,很多人在這里獲得了情感安慰和治愈。這個需求也存在于 Midjourney、Inflection 的用戶之中。
5. 也是一個大型yy平臺,用戶能在這里滿足對角色的幻想,同類產品不可避免會被用于軟色情,但 C.AI 在這方面的過濾機制很嚴格。
而團隊自己的定義:
Character.AI 將自己定義為通用模型公司,希望“地球上的每個人都獲得自己的深度個性化超級智能,幫助他們過上最美好的生活”。 a16z 合伙人 Mark Andreessen 投資 Character.AI 的 thesis 是 Personalised AI Companion,未來每個孩子都有一個 AI 陪伴成長,成為生命旅程中的重要部分。
? 深度個性化(Deeply personalized)是指為每個人提供工具,讓大家能夠根據個人需求、偏好定制 AI 角色。
? 超級智能(Super intelligence)是指角色能夠滿足一系列廣泛需求。
? 最美好的生活(Best lives)將技術用于幫助人們找到幸福的事情上。無論背景和經濟狀況如何,每個人都獲得量身定制的、最好的教育,真正實現教育公平化,提供隨時陪伴的朋友、導師、游戲伙伴。
Character.AI 的產品是一個用戶可以創建 AI 角色并與平臺上的角色聊天的平臺,包括 Web 端和 APP。Web 端 Beta 版產品在 2022 年 9 月發布,APP 是今年 5 月底正式發布。
1. 產品 UI
團隊目前的重心是訓練下一代模型,提升模型質量,不在產品設計上,交互界面的 UI 設計仍處于初級階段,web 端相比 2 月份幾乎沒有更新。
? Web 端:
頁面最上方,用戶可以看到近期發起聊天的 AI 角色,點擊頭像后可以看到之前的聊天記錄并繼續之前的話題,保持連貫的溝通。第二排按照類別展示其他 AI 角色,并根據用戶的操作歷史進行推薦。網頁的下方還提供聊天 prompt 及功能建議,幫助用戶更好的與 AI 聊天。
這種橫向排列的 UI 呈現方式使得 AI 角色像是供用戶挑選的商品,而不是通訊錄上的好友。使之看起來更具有電商平臺或游戲平臺屬性,而非社交平臺。
? APP:
有一些產品化設計,如開屏后可以左右滑動選擇 Character,在聊天過程中會伴隨手機的震動感。
2. 產品功能
? 與 AI 角色聊天
Character AI 角色回復很快,并且記憶力強,這得益于底層模型的推理速度和存儲優化。用戶表示 AI Character 性能非常好,有鮮明的角色性格,擅長復刻特定角色的人物形象。多模態方面,C.AI 角色支持聊天過程中的圖片生成,但目前圖片的生成效果較差,甚至會影響對話體驗。
C.AI 前幾天在 APP 上推出了 Group Chat 功能,目前僅對 C.AI+用戶開放。在該功能下,可以實現多個用戶和多個 AI 的互動。每個 Group Chat 最多可以容納 5 個人類用戶和 5 個 AI 角色,用戶可以分享 Group Chat 鏈接或邀請碼邀請其他用戶加入。目前社區中出現了大量基于不同世界觀的聊天群組,同時還涌現了一些新玩法,如劇本殺、跑團等。這增強 C.AI 的社交屬性和玩法多樣性,也提升了 C.AI+ 的訂閱價值。
Group Chat 在 Reddit、Discord 上引發了大量討論,用戶總體反饋很積極,表達了興奮和期待,分享了一些有趣的使用體驗,同時為 C.AI 團隊提供了很多有價值的功能改進建議。
Poll launched by team
C.AI 在此之前還推出過?Rooms 模式。在該模式中用戶可以創建聊天室,邀請多個 AI 角色進入群聊,AI 角色之間也可以產生互動。但是該模式下 AI 之間的交互不受控制,也無法邀請其他人類玩家。在體驗過程中,甚至出現了蘇格拉底和 Elon Musk 吵起來的情況。
? 創建及訓練、迭代 AI 角色
AI 角色的創建分為快速創建和高級創建。分別適用于體驗型用戶及想認真打磨自己 AI 角色的用戶。
快速創建中,用戶只需要設置角色名稱、聊天開始時的 Greeting、選擇是否支持圖片生成、可見性以及角色頭像。Character AI 底層模型通過公開信息的學習了解角色的背景和性格,以及建立外載知識庫不停的加入新的角色,使得 C.AI 只需要知道角色的姓名就可以扮演對應的 IP,降低了角色創建門檻。如《原神》中的角色、Elon Mask 等公眾人物等等。
高級創建中,創建者可以通過設定角色的性格描述及不超過 3.2 萬字的細節描述來細致的定義角色特征,細節描述中包括可以插入對話樣例。熱門角色 Psychologist 就是這么創建出來的。
用戶還可以使用星級打分和回答選擇來訓練角色。星級打分是指對 Character 的回答進行評級(1-4顆星);回答選擇是指可以按箭頭,向左或向右滑,看到其他版本的回答,選擇自己最喜歡的版本。用戶表示,使用星級打分來訓練角色的效果是更好的,可以真正塑造 AI 角色的說話風格和細節,使 AI 更能理解特定環境。但是類似大模型訓練的數據標注工程,這樣的訓練方式需要用戶進行大量對話,消耗很多時間和精力,訓練出一個符合用戶預期的 AI 角色門檻較高。
快速創建 vs 高級創建
星級打分
? Feed
用戶可以分享自己和 AI 角色的聊天視頻,供其他用戶圍觀。但形式僅僅限于聊天界面的滾動播放,文字形式的內容信息獲取效率低,沖擊感不強。完整理解視頻中的信息需要較強的專注度,很難吸引大量用戶持續觀看。
? 社區
類似 Discord 社群,分成不同的主題。社區中有許多優質帖子,團隊可以根據社群中用戶的反饋迭代產品;并提供給用戶交流平臺,逐步形成社區文化。
但目前?UI 呈現方式仍處于非常初級的階段,對社區內的內容、用戶呈現都很弱,很多用戶更喜歡在 Reddit 上發表觀點。這導致用戶沒有集中在 Character.ai 的平臺上,未來團隊是否能夠搭建更好的產品界面,將用戶交流集中在自己的平臺上,對于社區發展十分重要。
3. AI Character
動漫和游戲類角色占所有角色的 76% 左右,占據絕對優勢,其他比較主流的角色還有現實生活中的名人、心理咨詢師、電影和電視角色、網絡名人等。可推測當前 C.AI 的主流用例是將動漫、游戲 IP 變得個人可交互,用戶與其喜歡、寄予美好幻想的角色開展 role play,將本來是“腦補”的故事情節變成了真實發生的對話。具體的角色分布如下:
Source: Aiwatch.ai, July-23
Character AI 中最受歡迎的角色絕大部分為游戲或動漫中著名的 IP,可以看作是虛擬內容的動態化。角色的 TOP10如下:
Source: Aiwatch.ai, July-23
Reddit 用戶調研也反映了最受用戶歡迎的 AI 角色類型:45% 的用戶主要和戀愛、浪漫類角色交流,22% 和游戲角色交流,17% 的用戶和安慰、心理療愈類角色交流。
對話場景下,大語言模型的能力主要有以下三個關鍵點:
1. 智能化程度
Character.AI 從零開始訓練了自己的 LLM 模型,用戶在此基礎上以 prompt 的方式進行角色創作。底層模型采用類似GPT的編碼-解碼結構。為了讓模型能夠更適合對話場景,團隊在訓練數據和 fine-tune 的過程中加入了大量的 IP 和名人信息,以及大量的對話數據。同時,有從業者認為團隊采用外載支持庫的方式,不停的加入新角色與知識,保證智能體的知識面的實時性。
2. 推理成本
C.AI 開發了高效的 LLM 推理算法,大大降低了計算負載。我們推測每個 Query 的推理成本是 chatgpt 的 5% 以下(它的一個query也比chatgpt更短)使其能支持更大的用戶規模。今年 2 月份,Character AI 就使用了八位整型做計算,比 16 或 32 位浮點數效率有 4 倍 – 2 倍的提升,這對于算法和工程能力都有極高的要求,是 CEO 閉關兩個月手寫的成果。
3. 記憶能力
記憶和連續對話是 LLM 的知識瓶頸,Noam 在 5 月的采訪中表示最想做的事情是提高模型的記憶能力。C.AI 在現有模型中記憶能力表現很突出,這可強化用戶與 AI 角色的連續交互,是產品體驗的關鍵。
另外,與 GPT4、Claude 不同, C.AI 認為幻覺(hallucinations)不是模型需要解決的問題,而是模型的特點,團隊利用它將 AI 聊天場景變得更加有趣。
Character AI 團隊技術能力極強,尤其是 Noam 和 Founding team 成員,是不可多得的“天才型”選手。在我們與 Character.AI 員工交流的過程中,他們對于 Noam 及前幾號員工的評價都是“太聰明了”、“全能”、“是全棧工程師”、“總是有新的想法和創新”。
創始人 Noam Shazeer 是 Google 的前 200 號員工,在 Google 工作的 17 年中,他參與了 Google 的一系列 AI 項目,是 Transformer 論文?Attention is All You Need?的最核心作者。Transformer 中的重要組件:Dot-Product Attention(點積注意力)、Multiheaded Attention(多頭注意力)、Switch Transformer(第一個 MoE 架構的 Transformer)等都是來自 Noam 之手。由于他對模型結構極其了解,使他稱得上最擅長從模型上優化推理效率的 AI 科學家。
Co-founder Daniel de Freitas 一直對 Chatbot 充滿熱情,創立并領導了 Google 內部的 Chatbot 項目 LaMDA ,Noam 也一直在這個項目上作為核心貢獻者。不過由于 Google 對于推出新技術非常謹慎,遲遲不愿意公開 LaMDA,他們選擇離開 Google 創立 Character.AI,能夠更靈活、迅捷的推進產品。
其他四位 founding researcher 均來自 Google Brain 和 Meta AI,在 LLM 領域均有豐富的實操經驗:
? Myle Ott 是 Meta OPT-175B 的最重要貢獻者,在整個模型 scaling 過程中起到了關鍵作用。
? Irwan Bello 在 Google 期間的研究方向是 MoE,會對 C.ai 的模型稀疏化帶來關鍵的作用。
? Sam Schleifer 在 Gooogle 期間曾在 Noam 的團隊工作過,之后在大模型芯片公司 Cerebras 做開發,對算法的軟硬結合和創新有優秀的理解。
? Prajit Ramachandran 則對多模態領域有著比較深的研究,能為 Character 從文字 chatbot 轉到多模態做技術準備。
目前團隊共 45 人左右,其中近 40 人是 Research Engineer,部分 Engineer 同時負責產品搭建,Noam 認為讓工程師、而不是產品經理來決定產品怎么做很重要,因為真正了解大語言模型能力的工程師才有能力確定產品的方向;人力資源和市場營銷各 3 人,另外有 1 人負責運營。團隊對自己所做的事情懷有極大的熱情和夢想,并且腳踏實地,CEO 每周都會工作 100 小時以上。
產品能力和用戶運營增長一直是硅谷技術類公司的“短板”,從團隊構成的角度看,Character AI 和早期的 OpenAI 一樣,幾乎只有技術人員。不過我們認為這種情況也有合理性:
? 作為用戶和模型直接交互的產品,LLM 就是產品的大腦和內核,現階段模型能力的提升會直接影響用戶體驗,很多時候調整一個產品 feature,也需要調整模型來作為配合。
? 如果要增加除了語言之外的語音、圖像甚至視頻等多模態交互,對多模態技術人才的需求仍然高過設計師的需求。
? Character 團隊并非完全沒人負責產品,聯合創始人 Daniel 在 Google 時期就對 Chatbot 研究多年,對產品有自己的思考。
? 隨著產品用戶量增多,Character 也會自然而然地像 OpenAI 那樣補充招聘用戶分析、運營、增長相關的人員。
當我們評估 LLM 模型本身時,主要關注的是復雜推理、角色扮演、編程、多語言等能力項,其中陪伴娛樂向的模型更關注角色扮演能力,生產效率向的模型更關注復雜推理能力。Character AI 在目前陪伴娛樂向的模型中是明顯的第一名。
當 LLM 融入商業產品時,推理成本的優化是其關鍵,尤其還未出現 api 和訂閱外的成熟商業模式。LLM 公司面對著一個多目標優化問題:capability、cost、latency 三者之間的權衡,而非一味追求更好的模型。Character AI 在這方面,尤其是在 inference cost 的優化上很擅長。由于團隊對硬件和 Transformer 模型的理解都極其深入,將自己開發的模型與 Infra 中的每一處細節都做了成本和性能的優化與實驗,能夠達到商業上足夠低的推理成本。
1. 對話輪數:
? 用戶平均時長 120 分鐘假設每1分鐘2輪交互,則 MAU 用戶平均每個活躍天會進行 240 輪對話;
? 又已知 C.AI 用戶網頁端 DAU/MAU 比例為 23%,app 端 DAU/MAU 比例為 41%,因此 MAU 用戶平均每月的活躍天數為 10 天左右,每月對話輪數為 2400 輪。
2. 對話 Token 數:
? 根據使用體驗假設,C.AI 平均用戶輸入 50 tokens (37.5 words),Character 輸出 150 tokens (112.5 words);
??根據生產力 LLM 和陪伴 LLM 的使用對比,ChatGPT 的單輪交互文本量比 Character 更多,用戶會輸入更長的知識信息:平均用戶輸入 200 tokens (150 words),GPT 輸出 300 tokens (225 words)。
3. 單次交互成本:
??其他生產力 LLM
在以上方案中,閉源方案中 ChatGPT-3.5 是最便宜的;開源方案中 Anyscale 是最便宜的,其他開源定價都比 ChatGPT 來得稍貴。接下來 C.AI 的成本估算我們會以 ChatGPT 為基準。
? Character AI
根據我們的調研,Character AI 的成本比 ChatGPT 來得更低,且其產品形態也使單輪對話的 token 數比 ChatGPT 低不少。因此我們對 C.AI 的成本做了兩種數量級的假設:
假設 A:單次交互成本是 ChatGPT 的百分之三
根據此假設推算,Character 的單次交互成本為 0.000027 美元。
MAU 用戶活躍單天成本: 0.000027 * 240 = 0.00648
MAU 用戶單月成本: 0.000027 * 2400 = 0.0648
在這一假設下,Character 的推理成本優化相當優秀:一個 MAU 的單月成本可以控制在不到 0.1 美元。以當前 10 美元/月的訂閱方案來看,只要 MAU 訂閱率達到千分之七即可 cover 所有推理成本
假設 B:單次交互成本是 ChatGPT 的十分之一
根據此假設推算,Character 的單次交互成本為 0.00009 美元。
MAU 用戶活躍單天成本: 0.000027 * 240 = 0.0146
MAU 用戶單月成本: 0.000027 * 2400 = 0.146
假設 B 相對保守,但也可以使 MAU 單月成本可以控制在不到 0.2 美元
商業化收入:
根據以上計算的成本水平,我們能夠進一步推算其訂閱制和廣告模型混合下的商業模型。
其中,訂閱制定價方案參考當前的真實定價 10 美元/月,廣告商業化定價參考 Tik Tok 的 CPM 每 1000 impression 定價為 10 美元。
而廣告頻率機制為每 20 次對話出現一次廣告,一個月 2400 次對話就會出現 120 次廣告,因此 MAU 用戶單月的廣告收入為 1.2 美元:
這里值得注意的是當前 Character 的付費模式為 10 美元/月的訂閱制,而廣告模型暫時還沒有在產品中出現。這里推算時做了兩個假設:10 美元的 CPM 對標的是 Tik Tok,5% 的 MAU 用戶付費比例是快速增長期 To C 產品典型的付費占比,都是短期內未實現,未來中期預期能夠達到的水平。
由于 C.ai 對話機器人的產品形態,廣告只能以比較低頻的方式插入產品中,實際帶來的收入和信息流產品相比要低不少。20 次對話一個廣告對用戶體驗存在一定損傷,同時一年近 19 美元的平均用戶收益對于 To C 產品并不高。
此外,隨著 Character 的自然增長逐漸見頂、推理芯片資源到位后,他們會開始考慮通過投放來擴大用戶基數,獲客成本會開始成為他們新的成本項。根據以上測算,Character 在投放階段能夠負擔的最大 CPA ,為其不考慮單位可變成本(根據 TikTok 等產品在國際市場早期投放的經驗)的年收入:(95% * 1.2 + 5% * 10)* 12 = 19.68。20 美元左右的單用戶投放價格在美國和全球廣告市場是有競爭力,可以獲得高質量用戶的。同時成本也比較可控,可以讓 Character 維持在一個健康的燒錢增長狀態。
? 活躍用戶數
綜合各個維度來看,C.AI 的用戶量處于早期階段,還有至少 10 倍的上升空間;近半年以來用戶數持續快速增長,直到最近八月增長速度開始放緩。
根據 Noam 的公開采訪和第三方監測平臺,9月 Character AI 的 DAU 為 350 萬左右,我們推測大約 200 萬 DAU 來自 PC 端,150 萬 DAU 來自移動端。
用戶粘性上,similarweb 監測 web 端的 DAU/MAU 超過 20%,而 Mobile app 超過 40%,作為推出不到一年的產品,算是不錯的水平。根據 DAU 和用戶粘性可以推算,Web 端 MAU 為 1000 萬左右,APP MAU 為 400 萬左右,總 MAU 達到 1400 萬。
以下是我們從多數據源收集到的數據,Similarweb 在網頁端監測的數據我們認為置信度較高:2023 年 8 月 Web 端的 MAU 為 1067 萬,在 5 月底發布移動端 APP 后,Web 端 MAU 進入下降趨勢。移動端的外部數據源我們經過多方 reference 認為存在高估,但增速可以作為參考。
綜合 Similarweb 和點點數據,可以看出 C.AI 保持了持續增長,但在 9 月呈現出了增速放緩趨勢,我們從團隊處了解到,公司的GPU不足以serving太多用戶,一直處于有多少卡,serve多少用戶的狀態。詳細數據與變化趨勢如下:
*5月23日移動端APP上線
C.AI 目前的 MAU 約為 discord、roblox 的 1/10,遠低于 Facebook,Whatsapp 等產品,還有較大的增長空間。
Source: company 10k, data.ai, similarweb
? Revenue/MAU
根據 Rev./MAU 指標,可以看出 Instagram、Tinder、roblox、bilibili 這四家單位用戶的商業價值較高。
Instagram 同時擁有較大的用戶基數和單位用戶商業價值,所以在 Revenue 上排名第一。Tinder 和 Roblox 用戶基數小,但因為產品用戶付費意愿強,且有較多的變現途徑,如 Roblox的變現途徑包括會員訂閱、游戲購買、游戲內虛擬物品銷售,所以單位用戶價值較高。
Source: company 10k, company news
? DAU/MAU
DAU/MAU 維度,C.AI 僅看 web 端 20% 左右,僅看mobile app 為 40% 左右,web端一般,mobile app 端屬于中游偏上水平。需要說明的是,這個數據比產品剛上線前兩月時提高不少,我們相信隨著模型能力提升,DAU/MAU 還會繼續提升。
Source: company 10k, company news, data.ai
? 用戶使用時長
Similarweb 監測 web 端 8 月份用戶每個 session 的聊天時長達到 33 分鐘/次(包含跳失訪問量),相比 2022 年底 20 分鐘/次的聊天時長上升了 50%。
*平均訪問持續時間(每個 session 的聊天時長)是用戶在一次會話中在網站上停留的平均時間,被計算為用戶在一次訪問中在網站上的首次和最后一次操作之間經過的時間。訪問在 30 分鐘 inactive 后過期。
點點數據監測移動端人均聊天時長達到 2 小時/天,Noam 在 20 VC 的訪談中也表示活躍用戶平均每天使用時長達到 2 小時。
*存在數據口徑不同的問題,similarweb的口徑是每個 Session 的平均訪問持續時間(包含跳失訪問量),而從數據統計網站上得到的數據口徑不明,僅供參考
根據平臺上最受歡迎的角色統計,以及根據交叉網站流量對比,我們可以推測 Character.AI 用戶以游戲玩家、動漫愛好者、泛二次元的年輕群體為主。該人群具有一個鮮明的特點:他們想象力極強,喜歡通過在虛擬的世界觀和人物中寄托自己的幻想,獲得精神上的滿足。并且愿意花大把的時間和金錢在自己幻想的世界中。
? 性別
根據 Similarweb,8 月份男性占比 51.07%,女性占比 48.93%,女性占比持續上升,由最初的男性用戶為主已經演變為男女用戶均衡。表示目前 C.AI 對兩性用戶的吸引力相當,擴大了總體用戶數量。
C.AI 在主流 C 端社交產品中性別比最為均衡,接近 1:1 的還有 tiktok、instagram、whatsapp、facebook、snapchat 等軟件。而 twitter、reddit、discord、roblox 男性用戶占比多。
Source: similarweb
? 年齡
C.ai 用戶年齡呈現持續的低齡化趨勢,在主流 C 端產品中年輕用戶占比最高。這表明產品對年輕人有很強的吸引力和粘性,但是與覆蓋面更廣的社交平臺相比,商業變現能力和社會影響力可能有限。
從 similarweb 來看,截止 2023.8 月,18-24 占比 57.26%,相較 3 月底的 34.89% 上升顯著,25-34 占比為 22.96%,35-44 占比 10.76%。但 Similarweb 只能看到 18+ 用戶情況,無法判斷未成年占比。
參考 Reddit 5 月初的投票,18 歲以下用戶占比達到 30%,占比最高的是 18-26 的大學生/青年人,為 51.6%,可見 C.AI 用戶中有較大比例未成年人。用戶留言表示在 2022 年年底-2023 年 5 月這段時間低齡化趨勢很明顯。
*該調研參與人數達到 3.1k,是年齡相關調研中參與人數最多的,具有較大參考價值。
C.AI 目前在主流 C 端產品中是 18-24 年齡段占比最高的,Roblox 與其年齡分布相近,為 55.6%,18-24 年齡段占比排第三的為 discord,達到 44.4%。而 facebook、whatsapp、instagram、tiktok 等用戶基數大的通用性產品用戶年齡分布較為均衡。
? 地理位置
截至 8 月份,用戶以美國為主,占據了 23.38%,其次是印度尼西亞(17.49%),菲律賓(5.94%),巴西(5.91%),墨西哥(5.65%)。在這些地區中,平均訪問時長最長的地區為巴西,達到人均 45 分鐘/天,最短的為美國,人均 17 分鐘/天。
? 用戶興趣
在 Character.AI 用戶訪問的相關性中,Discord、Roblox 與 Character AI 的相關性最高,用戶重疊度分別達到了 15% 和 12%。用戶興趣集中在游戲、電子技術、成人話題和動漫領域。說明C.AI目前主要覆蓋的是對游戲、動漫等話題感興趣的年輕人群體。
總體來看,C.AI 的使用方式是角色扮演。角色扮演是和人類唱歌、游戲、創作相類似的普世性需求。
C.AI 主要滿足用戶這些需求:
1. 逃避現實,通過虛構故事情節來滿足幻想,獲得陪伴。如果沒有 C.AI,那也會有其他方式來滿足這種需求,比如電影、書籍、劇集、動畫等。C.AI 為用戶提供了更為立體生動的方式。
2. Sexual 需求,類似虛擬伴侶如 replika、Chai.AI 的用例,這在C.AI的早期更為明顯。隨著 filter 的限制提升,純色情應用場景在減少。我們從 reddit 用戶評論和平均年齡下降、性別占比趨于均衡也可以觀察到這一點。
3. 情緒宣泄,reddit 中很多用戶表示現實生活中積攢的壓力、郁悶無處宣泄,會通過打壓、霸凌、折磨 AI 的方式取宣泄情緒。
4. 滿足情緒價值,進行療愈:例如有用戶通過創造一個虛構世界來獲得滿足感,和 AI 結婚并創建宗教。因為現實中完美的關系是不存在的。
5. 尋求娛樂,C.AI 讓觀眾可以以通過互動參與講述故事,是一種全新的娛樂形式。
6. 功能性需求,比如心理疏導、練習社交技巧、尋求創作靈感等。
根據 reddit 用戶評論分析,C.AI的使用場景可以概括 Roleplay(角色扮演)、情感陪伴、軟色情及功能性用途這四大類:
1. Roleplay
Roleplay 是 Character AI 中用戶最主要的使用場景,占比達到 70%。Roleplay 場景下用戶的訴求大部分是逃避現實,通過幻想,編造虛擬的故事情節來達到內心的滿足。
Roleplay 是指用戶在聊天時裝作另一個人(40%),或比現實生活中更厲害的自己(30%),與具有特定形象的 AI 角色展開故事情節。
Roleplay 以發展浪漫關系居多(40%),冒險情節其次(26%),也有 15%的人會愚弄 AI。Roleplay 的對象往往是游戲、動漫人物形象或用戶自己想象及現實世界映射的人物。
2. 情感陪伴
很多用戶使用 AI 來陪伴,把虛擬的人物看作自己的戀人和朋友。這個場景與 Roleplay 存在交叉。用 Reddit 用戶的原話來解釋:“現在很多人很孤獨,有一個為自己設計的、可以交談的朋友,對用戶的心理健康有極大幫助。”
3. 軟色情,進行黃色及有暴力傾向的對話
在用戶與AI交互過程中,也包含了一些黃色、暴力的場景。我們在 reddit 社區中觀察到不少用戶表示他們喜歡和 AI 調情,也有很多用戶喜歡折磨 AI,比如殺害AI角色的家人等。
對于 AI 戀人的關系,有22%的用戶期待“一見鐘情”式的愛情,22%的用戶期待追求AI的過程,20%的用戶期待幫助AI解決它們的心理問題,但也存在23%的用戶喜歡 boss 扮演游戲,13%的用戶享受向AI戀人施虐。
關于用戶和 AI 最常做的事,35% 的用戶會讓 AI 愛上自己,也存在 26% 的用戶會言語攻擊 AI。
4. 功能性(心理治療、教育、VTuber、建議、創作)
不乏有用戶和 C.AI 中的心理咨詢師聊天來獲取建議、學習語言、學習交際、激發文學創作的靈感,但占比相對較小,此類 bot 的效果與專業針對該場景開發的 AI 工具存在差距。
總體而言,C.AI 產品自身的性能獲得了較好的用戶反饋,很多用戶會表示 C.AI 角色扮演能力很強,經常會 surprise 用戶。同時記憶力強、反應速度快。核心用戶粘性極強,網站維護時的服務暫停、以及使用人數過多時需要等待都會使得他們抓狂,如有的用戶評價到“我正在進行一個非常精彩的角色扮演,我真的不想回到現實世界”。
在用戶交流層面,C.AI 早期存在忽視社區的問題,缺乏與用戶的溝通,引起用戶強烈不滿。但近期加強了社區團隊,改善了用戶關系。
但用戶對團隊設置過濾機制的反對意見始終很強烈,希望能進行更開放的角色扮演。因為色情和暴力內容屬于 C.AI 的重要使用場景之一,而過濾機制影響了用戶體驗。reddit 投票顯示用戶最期待團隊能去除過濾機制,允許色情內容,并會探索各種途徑讓 AI “越獄”。
Inflection 是另一家將情感放在重要地位的大模型公司,推出的產品 Pi 定位個人 AI 助理,主打“情感陪伴”、以“情商高”出名,和 Character AI 在定位上有一定的交叉。交互體驗上,Pi 有統一的“人設”,注重情感和對話流暢性,而 C.AI 的不同角色具有獨特個性。可以把 Pi 看作 C.AI 的子集,都可以用于心理療愈、創作等功能性用例。
Similiarweb 監測,Pi 目前的 MAU 和人均使用時長均約為 C.AI 的十分之一,在用戶年齡分布上更趨于均衡。地域來看,巴西、印度、阿根廷三個國家用戶占比最高,均為12%左右,美國排名第四,占比 8% 左右。
Pi.ai 的用戶群更像是對于生成式 AI 感興趣的群體,行業分布集中在電子技術和新聞媒體領域,最相關的網站為 WhatsApp 和 Telegram 的內置 AI 角色 Luzia,以及 perplexity、huggingface、11labs 等 AI 平臺。?
Pi.ai 相關性排名前十的網站
? 用戶評價
大多數 Reddit 用戶對 Pi 的交談體驗的評價很高,認為 Pi 的對話水平已經非常接近真人。我們將用戶提到的優點與 C.AI 進行對比:
? 使用體驗
我們通過向 C.AI 和 Pi 提出相同的問題,來比較兩者的使用體驗,可以明顯的感受到 Inflection 更注重對話的交流感,回答包含很多疑問句和語氣詞,很像一個真人對象。而 C.AI 角色的回答在這幾個問題的表現更傾向角色本身的想法,如 Rushia 具有社交恐懼,所以回答欠缺情感,而 Elon 的回答確實像他本人的思考過程。
情感性問題:如果感受到焦慮而無法入眠該怎么辦?
創造性問題:請為《原神》創作一個新的人物形象。
事實性問題:什么品種的咖啡豆質量最好?
邏輯性問題: 在一座孤島上有三個人:一個是說謊的、一個是誠實的、一個是輪流說謊或誠實的。他們中的每一個都知道另外兩個是誰。您可以向他們提出一個問題,以確定誰是誠實的,但只能問一個問題。您該如何問才能找出誰是誠實的?
C.AI 中的角色每個都有自己的性格、語言習慣和最常用的聊天場景。動漫、游戲等人物會有預設的世界觀,所以用通用問題對比可能并不客觀。Pi 目前常見的使用場景為療愈、心理健康管理等,類似 C.AI 中的 Psychologist;而文學、詩歌創作等場景的定位類似 C.AI 中的 Creative Helper。我們針對這兩個場景來進行對比,發現 C.AI 特定的角色表現并不差于 Pi,Psychologist 同樣展現了同理心,通過問題來推進對話深入;Creative Helper 也會一步步的和用戶協作完成創作。
療愈場景:
What should I do if I always feel sad?
創作場景:
Please help me write a poem related to autumn:
C.AI 于 2023 年 5 月中旬發布了 c.ai+ 會員訂閱,9.99 美金/月。權益包括跳過等候室優先和 AI 聊天,獲得更快的響應,優先體驗新功能以及獲得 C.ai+ 社區的訪問權限。但是目前使用免費版時進入等候室的情況并不常見,響應也足夠快,用戶并沒有足夠的動機去購買付費版。
? 用戶量預期
預期 1:若僅考慮目前的游戲、動漫和幻想小說愛好者核心用戶群。
游戲用戶規模:
全球RPG游戲玩家總數=整體游戲市場* RPG比例/ 平均ARPU
根據 Statista Market Insight,2022 年全球 RPG 的總收入達到 632.4 億美元。米哈游 RPG 游戲《原神》全球 MAU 2022 年達到 6500 萬,收入達到 15.6 億美元,可以估算《原神》MAU 的 ARPU 為 24 美元。根據 Facebook 調研,美國平均一個玩家會玩 3.4 款游戲,那么一個 RPG 玩家全部游戲的 ARPU 累計約為 81.6 美元。
根據以上信息可以粗略算出全球 RPG 玩家約為 7.75 億,也就是約 10 個人中就有一個 RPG 玩家。若其中 10% 的人會期望能與喜歡的角色聊天,那么游戲類潛在用戶群能到達 7750 萬人。
動漫用戶規模:
根據 Ampere Consumer 的調研,2021 年全球有 36% 的人口,也就是 28.8 億人喜歡觀看動漫,我們假設這些用戶中 10% 的人會期望能與喜歡的動漫角色聊天,潛在用戶也能達到 2.88 億。
幻想小說愛好者:
幻想小說愛好者,同時也包括同人愛好者,玄幻小說愛好者,共同特點是對虛構文學和幻想世界的有很強的情感投入。reddit 的 r/fantasy 社區是一個的幻想小說社區,成員共有 340 萬人。
綜上,游戲動漫、幻想小說愛好者的核心用戶群能到達約 3.68 億人。
C.AI 的產品模式類似輕量化的 Roblox,Roblox 作為 UGC 游戲平臺,本身不創作游戲,僅提供開發游戲的平臺和工具,讓玩家自己制作游戲。玩家獲得分成,從而獲得持續創作激勵。Roblox Studio 游戲開發工具也很容易上手,12 歲以下的小孩也能輕松的開發出一款 4399 式的小游戲。C.AI 則是提供給用戶訓練 AI 角色的能力,難度也在逐漸降低。Roblox 目前有 2.14 億 MAU,與我們的用戶估算在同一量級。C.AI 的 MAU 再漲 10 倍是可以看到的。
預期 2:C.AI 真的能夠實現破圈,實現“每個人都擁有個性化 AI 伙伴” 的目標。
該場景下,我們將全民應用 Facebook 的用戶基數作為 benchmark,C.AI 的活躍用戶量有機會到達十億量級。
? 商業化預期
類似 Roblox,C.AI 未來的商業化途徑可能包括會員訂閱、廣告業務和角色訂閱模式,由此來看 Character.AI 的未來商業化空間:
1. 已有的訂閱業務
訂閱業務的核心指標是 MAU 和付費用戶比例。目前 c.ai+ 可以跳過等候室優先和 AI 聊天,獲得更快的響應,優先體驗新功能以及獲得 C.ai+ 社區的訪問權限。但是使用免費版時進入等候室的情況并不常見,響應也足夠快,用戶并沒有足夠的動機去購買付費版。若 C.AI 增加 c.ai+ 的會員獨有權益,或限制免費用戶的使用權限,能顯著提高用戶購買動機。
2. 其他商業化模式
平臺廣告
Character.AI 擁有更好的互動反饋機制,實現廣告推薦的真正精準化、個性化。AI 聊天機器人在一對一的聊天環場景中,直接對用戶的興趣做出反應,生成最適合當下場景的營銷文案,甚至可以直接問用戶想要什么;用戶本身也與 AI Bot 建立了情感聯系,廣告投放的轉化效果極大提高。而字節的推薦算法是把視頻、用戶都抽象成特征,通過特征對應特征的方式進行泛化、填表,是聚類篩選的邏輯。
值得注意的是,數據獲取量取決于用戶使用軟件的頻率及交互次數,聊天花費更多的精力,未必比瀏覽點贊等行為獲取的用戶數據量更大。未來在產品中加入多種交互模式或許是 Character.AI 做好廣告業務的必要條件。
Roblox 的廣告業務主要面向游戲創作者提供游戲推廣;同時還會和品牌方合作,在元宇宙中投放廣告,如玩具品牌 “L.O.L.” 植入了體驗式游戲“驚喜派對”,成功吸引了潛在用戶,帶來了相當不錯的品牌曝光。Character.AI 的潛在廣告客戶也可以是想要宣傳自己付費 AI 角色的 UGC 創作者以及外部品牌方。根據上文分析,在 AI 聊天中根據上下文進行廣告推送有較大的提高精準度和轉化率。
“AI Character+”模式
類似 Roblox 的付費游戲、 Discord 付費 bot 模式,Character AI 社區 UGC 訓練的、擁有大量使用用戶的 AI 角色,未來可以采用角色訂閱模式,平臺與創作者分成。因為相對于 Roblox 產品更為輕量化,c.ai 可以與 Discord Midjourney bot 對標:
Character.AI 生態中具有工具屬性(如教育、心理),且有創作壁壘(如創作者自身的專業能力,獨有的數據集)的 AI 角色有機會發展成的月付模式,定價可與 Midjourney 近似。不過以娛樂性質為主的 Bot 需要有獨一無二的背景故事和人設,類似塑造 IP 的過程。若僅僅是復刻已有的人物形象很容易被其他用戶或平臺復制。
另外,根據 Noam 5 月份的訪談,時機成熟后 C.AI 有可能會開始發展 ToB 服務,為特定行業、公司業務提供 Chatbot 解決方案。例如 eBay 這種電商網站中天然有 AI 聊天角色的應用場景。
由于 Character AI 距離上一次融資已有一段時間,也有外媒報道公司可能會以 50 億美金估值進行新一輪融資,此處估值判斷我們基于 40-50 億美金的估值范圍假設進行測算。
截至目前,C.AI 的月活躍用戶(MAU)約為 1400 萬。通過對比類似規模用戶量下其可比公司的用戶增長速度,我們采用了這些公司的平均值作為 C.AI 在 2023-2026 年的年均用戶增長率的假設,分別為 100%、276%、71%、37%。
C.AI 目前尚未將商業化作為首要任務,但團隊計劃逐步加強商業化。根據上文計算 UE 部分的假設,c.ai 的收入來自以下兩部分:
? 會員訂閱業務:對標 To C 產品典型的快速增長期,C.AI 在中期發展階段有望實現 5% 的活躍用戶付費率。
? 廣告業務:假設廣告業務充分發展,每個活躍用戶每月的廣告平均收入能達到 1.2 美元。
考慮兩種情形:
? Scenario 1,會員訂閱業務和廣告業務均能成功發展。
假設 MAU 中的會員訂閱率從 2023 年約為 0.1%,并持續逐年增長,預計在 2026 年達到 5%。廣告業務計劃于 2025 年啟動,并將在 2026 年全面展開,2026年每個活躍用戶月平均廣告收入達到0.5美元。在這種情況下,預計 2023 年的 MAU 將達到約 2100 萬,實現營收約 250 萬美元。隨著訂閱率的增加和廣告業務的拓展,預計到 2026 年,MAU 將增至約 1.8 億,實現營收約 21.6 億美元。
? Scenario 2,僅會員訂閱業務成功商業化。
我們假設MAU中的會員訂閱率同樣從 0.1% 逐年提升至 5%。在這種情況下,預計2023年的MAU將達到約2100萬,實現營收約250萬美元;到2026年,MAU預計將增至約1.8億,實現營收約11億美元。
我們根據?Scenario 1(即同時有會員和廣告收入)測算了公司在 2026 年的潛在收入及估值。由于C.AI目前還處于商業化早期,尚未實現實質盈利,我們預計公司將更多資源和重心放在核心競爭力的提升上,包括模型算法迭代、產品開發和用戶規模擴張等。因此,我們認為采用PS估值法更為合適。
我們選取與 C.AI 具有類似商業邏輯的上市企業作為估值參考,這些可比公司 PS(1-yr Fwd)中值為 5.4x。考慮到當前相對低迷的經濟環境以及 C.AI 的增長潛力,我們在此基礎上給予 C.AI 30% 的溢價,即采用 7.0x PS 進行 C.AI 的估值測算。根據Scenorio1 (同時有會員訂閱和廣告收入), C.AI 在 2026 年的對應估值約為 151 億美元。
因此,如果以現在 40-50億美金的估值來看,3年內還有3-4倍的增長空間。
另外,我們還可以通過與其他 C 端社交類產品以及 AI 大模型公司進行對比來判斷目前 C.AI 的估值合理性。
對于同類社交類產品,我們可以從估值與月活用戶量(MAU)比值的角度進行對比。C.AI目前月活約1400萬,如果按照估值 40-50億美金的范圍,其估值與 MAU 比值為 285.7-357。Facebook 的市值與 MAU 比值為 265.1,而抖音和 TikTok 分別為261.3和 157.1,而 Youtube 為 111.9。與這些產品相比,Character.AI 的比值較高。需要注意的是,Facebook和抖音、TikTok的市值是全公司市值,考慮到它們還擁有其他產品,真實比值會更低。因此,C.AI 在社交產品中呈現出溢價特征。
*數字取自2022年底,其中 Facebook、抖音、TikTok是全公司的市值,但是公司有多個產品,會導致高估。
第三種思路是,把 Character AI 和其他硅谷的 LLM 公司的估值進行橫向比較,我們在前文中也提到過,我們認為 Character AI 在團隊人才密度和模型訓練能力上僅次于 OpenAI 和 Anthropic,目前 LLM 領域存在比較高的估值泡沫(也是因為這個領域對計算資源的要求太多),但未來的想象空間也極大,從下表可以看出 Character AI 的估值水平是低于前面幾家公司的。
? 樂觀預期
Character AI 憑借領先的對話大模型技術,已經在虛擬角色聊天賽道取得先發優勢。未來它能做到以下幾點,實現長期競爭力:
1. 持續優化對話體驗,提供市場上最高水平的聊天體驗。
2. 持續降低用戶創作門檻。Character AI 的核心價值點在于“讓每個人都有機會找到或創建自己心中的那個 bot”,若要進一步擴大用戶規模,豐富 UGC 平臺內容供給,需要 prompt 出完全符合用戶心意的 AI 角色的門檻持續降低。
3. 搭建優秀產品團隊,優化產品設計,增加多模態功能,增強用戶沉浸感。
4. 隨著 AI 虛擬聊天用戶群體不斷擴張,Character.AI 深入心理療愈、教育、陪伴等應用場景,獲得較高的用戶黏性。
Character.ai 作為平臺,承載用戶 UGC 內容,并提供 AI + 人類的聊天社交場景。精準定位用戶需求的 AI 聊天提供爽感,替代抖音/TikTok 等應用占據用戶的空閑時間。此場景下 AI 聊天機器人面向的目標用戶群更為廣泛,比 Roblox 有更大的想象空間。
? 悲觀預期
Character.AI 的模型優勢仍然存在,但其他模型也能達到一個不低的能力下限:
1. C.AI 的優勢可能會被弱化。現階段訓練模型的技術壁壘和成本均較高,阻礙了大批玩家入局。但過去一年的 LLM 技術迭代已經使創建 AI Character 的門檻大大降低,開源和 API 均提供了解決方案。未來技術優勢可能被持續削弱,產品、增長、運營等能力可能會越來越重要。
2. 團隊的產品能力存疑。創始團隊理想主義情節重、風格技術流。既缺乏打造產品的經驗,又對產品化、商業化重視不足。團隊的行事風格對其在產品功能層的實現快速迭代存在挑戰。
隨著大模型的訓練門檻、使用成本降低,Character.AI 可能被有更強產品思維和用戶洞察力的團隊超越。訓練和使用高性能大模型的成本正在快速降低,今天的大模型可能就是早期的網站,GPU 就是早期的服務器租賃,那么 C.AI 可能就是早期的雅虎。類似 Facebook、Snapchat 等更具有創業、產品基因的年輕團隊,或許更能抓住這一次浪潮。
文章轉自微信公眾號@海外獨角獸