想了解比較報告的深度內容,點此查看完整報告

效果評測

冪簡提供一個測試眾多AI大模型API的平臺,在這個試用頁面用戶可以選擇不同的AI大模型在相同提示詞下去驗證各個模型的生成效果。下面我們將選取DeepSeek R1、hunyuan t1 latest、 通義千問2.5-Math-72B這三個模型,在冪簡的試用平臺中驗證一下各個模型的數學解題能力。

提示詞

雞兔同籠共35個頭,94只腳,問雞和兔分別有多少只?

DeepSeek R1

驗證上圖效果請點擊AI數學模型API試用

騰訊混元 hunyuan t1 latest

驗證上圖效果請點擊AI數學模型API試用

通義千問2.5-Math-72B

驗證上圖效果請點擊AI數學模型API試用

評測維度總結

a. DeepSeek R1

b. hunyuan t1 latest

c. 通義千問2.5-Math-72B

總結

三個模型均能正確解決該問題,顯示出較強的數學推理能力。通義千問2.5-Math-72B 因其更詳細的推導和驗證過程表現最佳,DeepSeek R1 和 hunyuan t1 latest 也表現出色,但推導細節略少。

基礎參數維度對比

我們選取國內數學大模型中的DeepSeek R1、通義千問-Max、hunyuan-turbos-latest三個大模型在基礎參數維度進行對比。

基礎參數數據對比

DeepSeek通義千問騰訊混元
uid20240729044910fbb569uid20250401967412f68cc1uid2024053043891289b978
模型信息
API模型名稱DeepSeek R1通義千問-Maxhunyuan-turbos-latest
描述DeepSeek R1是由杭州深度求索公司開發的強化學習驅動的大型語言模型,專注于數學、代碼和自然語言推理任務。該模型基于6710億參數的混合專家架構(MoE),通過多階段強化學習訓練實現自我進化能力,無需依賴人工標注數據,在AIME等測試中性能超越OpenAI o1等閉源模型。通義千問-Max,即Qwen2.5-Max,是阿里云通義千問旗艦版模型,于2025年1月29日正式發布。該模型預訓練數據超過20萬億tokens,在多項公開主流模型評測基準上錄得高分,位列全球第七名,是非推理類的中國大模型冠軍。它展現出極強勁的綜合性能,特別是在數學和編程等單項能力上排名第一。Hunyuan-Turbos-Latest是騰訊混元團隊推出的新一代快思考模型,具備高速響應和高效性能,能夠實現“秒回”。該模型在知識、數學、推理等多個領域表現出色,具備廣泛的知識覆蓋和準確的推理能力。用戶可以通過騰訊云API調用該模型,享受高速、高效的模型服務。
價格
免費試用500萬Tokens贈送100萬Tokens額度
有效期:百煉開通后180天內
共計100萬 Tokens,共享消耗。資源包有效期為1年,自開通服務之日起1年內若免費資源包次數未使用完,則過期作廢。
輸入價格(緩存命中)0.0005元/1千Tokens0.0024元/1千tokens0.0008元/1千tokens
輸入價格(緩存未命中)0.002元/1千Tokens0.0024元/1千tokens0.0008元/1千tokens
輸出價格0.008元/1千Tokens0.0096元/1千tokens0.002元/1千tokens
基礎技術參數
輸入方式純文本輸入文本/圖片/視頻鏈接文本/視頻片段/API參數化輸入
輸出方式文本文本文本
上下文長度(Token)64K32k64k
上下文理解長文本邏輯連貫性優化支持跨模態關聯推理多場景上下文動態綁定
文檔理解N/AN/AN/A
是否支持流式輸出
是否支持聯網搜索N/A
是否開源
多模態支持純文本生成支持文本+圖像生成文本+視頻生成(需API接入)

如果想了解更詳細報告,點此查看完整報告

能力總結

綜合對比

根據需求選擇:

總結

上面我們重點講了DeepSeek R1、通義千問-Max、hunyuan-turbos-latest3個模型的數學解題效果,以及對這三個模型的基礎參數進行了對比。

如果想要從價格、服務穩定性、互聯網口碑等維度進行選型的話,請點此查看完整報告或可以自己選擇期望的服務商制作比較報告

上一篇:

2025年國內AI推理大模型效果對比:DeepSeek、通義千問、騰訊混元

下一篇:

2025年全球數學AI大模型深度評測與排名分析
#你可能也喜歡這些API文章!

我們有何不同?

API服務商零注冊

多API并行試用

數據驅動選型,提升決策效率

查看全部API→
??

熱門場景實測,選對API

#AI文本生成大模型API

對比大模型API的內容創意新穎性、情感共鳴力、商業轉化潛力

25個渠道
一鍵對比試用API 限時免費

#AI深度推理大模型API

對比大模型API的邏輯推理準確性、分析深度、可視化建議合理性

10個渠道
一鍵對比試用API 限時免費