
如何使用 node.js 和 express 創建 rest api
想了解比較報告的深度內容,點此查看完整報告
冪簡提供一個測試眾多AI大模型API的平臺,在這個試用頁面用戶可以選擇不同的AI大模型在相同提示詞下去驗證各個模型的生成效果。下面我們將選取DeepSeek R1、hunyuan t1 latest、 通義千問2.5-Math-72B這三個模型,在冪簡的試用平臺中驗證一下各個模型的數學解題能力。
提示詞
雞兔同籠共35個頭,94只腳,問雞和兔分別有多少只?
驗證上圖效果請點擊AI數學模型API試用
驗證上圖效果請點擊AI數學模型API試用
驗證上圖效果請點擊AI數學模型API試用
總結
三個模型均能正確解決該問題,顯示出較強的數學推理能力。通義千問2.5-Math-72B 因其更詳細的推導和驗證過程表現最佳,DeepSeek R1 和 hunyuan t1 latest 也表現出色,但推導細節略少。
我們選取國內數學大模型中的DeepSeek R1、通義千問-Max、hunyuan-turbos-latest三個大模型在基礎參數維度進行對比。
DeepSeek | 通義千問 | 騰訊混元 | |
uid20240729044910fbb569 | uid20250401967412f68cc1 | uid2024053043891289b978 | |
模型信息 | |||
API模型名稱 | DeepSeek R1 | 通義千問-Max | hunyuan-turbos-latest |
描述 | DeepSeek R1是由杭州深度求索公司開發的強化學習驅動的大型語言模型,專注于數學、代碼和自然語言推理任務。該模型基于6710億參數的混合專家架構(MoE),通過多階段強化學習訓練實現自我進化能力,無需依賴人工標注數據,在AIME等測試中性能超越OpenAI o1等閉源模型。 | 通義千問-Max,即Qwen2.5-Max,是阿里云通義千問旗艦版模型,于2025年1月29日正式發布。該模型預訓練數據超過20萬億tokens,在多項公開主流模型評測基準上錄得高分,位列全球第七名,是非推理類的中國大模型冠軍。它展現出極強勁的綜合性能,特別是在數學和編程等單項能力上排名第一。 | Hunyuan-Turbos-Latest是騰訊混元團隊推出的新一代快思考模型,具備高速響應和高效性能,能夠實現“秒回”。該模型在知識、數學、推理等多個領域表現出色,具備廣泛的知識覆蓋和準確的推理能力。用戶可以通過騰訊云API調用該模型,享受高速、高效的模型服務。 |
價格 | |||
免費試用 | 500萬Tokens | 贈送100萬Tokens額度 有效期:百煉開通后180天內 | 共計100萬 Tokens,共享消耗。資源包有效期為1年,自開通服務之日起1年內若免費資源包次數未使用完,則過期作廢。 |
輸入價格(緩存命中) | 0.0005元/1千Tokens | 0.0024元/1千tokens | 0.0008元/1千tokens |
輸入價格(緩存未命中) | 0.002元/1千Tokens | 0.0024元/1千tokens | 0.0008元/1千tokens |
輸出價格 | 0.008元/1千Tokens | 0.0096元/1千tokens | 0.002元/1千tokens |
基礎技術參數 | |||
輸入方式 | 純文本輸入 | 文本/圖片/視頻鏈接 | 文本/視頻片段/API參數化輸入 |
輸出方式 | 文本 | 文本 | 文本 |
上下文長度(Token) | 64K | 32k | 64k |
上下文理解 | 長文本邏輯連貫性優化 | 支持跨模態關聯推理 | 多場景上下文動態綁定 |
文檔理解 | N/A | N/A | N/A |
是否支持流式輸出 | 否 | 是 | 是 |
是否支持聯網搜索 | 否 | 是 | N/A |
是否開源 | 否 | 否 | 否 |
多模態支持 | 純文本生成 | 支持文本+圖像生成 | 文本+視頻生成(需API接入) |
如果想了解更詳細報告,點此查看完整報告。
根據需求選擇:
上面我們重點講了DeepSeek R1、通義千問-Max、hunyuan-turbos-latest3個模型的數學解題效果,以及對這三個模型的基礎參數進行了對比。
如果想要從價格、服務穩定性、互聯網口碑等維度進行選型的話,請點此查看完整報告或可以自己選擇期望的服務商制作比較報告。