
使用LoRA(低秩適應)微調大型語言模型的實用技巧
API模型名稱 | 輸入方式 | 輸出方式 | 上下文長度(Token) | 上下文理解 | 文檔理解 | 是否支持流式輸出 | 是否支持聯網搜索 | 是否開源 | 多模態支持 |
---|---|---|---|---|---|---|---|---|---|
DeepSeek-R1 | 文本/圖片 | 文本 | 64K | ? | ? | ? | ? | ? | 純文本生成 |
Grok-3 | 文本、圖片 | 文本 | 128K | ? | ? | ? | ? | ? | 是 |
gpt-4o | 文本 | 文本 | 12.8k | ? | ? | ? | ? | ? | 是 |
DeepSeek-R1和Grok-3在多模態輸入和上下文理解上表現突出,而gpt-4o雖不支持圖片輸入和聯網搜索,但在文檔理解和上下文長度方面有優勢。DeepSeek-R1開源且支持流式輸出,適用于需要實時處理和多模態輸入的場景;Grok-3適用于需要聯網搜索的復雜任務;gpt-4o則適合文本處理和文檔理解任務。
以下分別是從代碼能力、邏輯推理能力以及文學能力對DeepSeek-R1、Grok-3和gpt-4o的接口測試效果進行比較
結合現實經驗,不限制任何方法,一根5.5米長,直徑20毫米的竹竿,能否完好通過寬4米高3米的矩形門
從測試生成效果不難看出,Grok 的測試效果最好。 它不僅得出了符合現實的結論,而且分析過程清晰、全面,很好地結合了理論計算和實際物體特性。
寫一段html代碼,網頁中間是一個正六邊形,有一個質點在六邊形中有一個初速度,碰到六邊形的邊界就反彈,每次碰到邊界時邊界隨機變換顏色
從測試生成效果不難看出,deepseek r1代碼效果最佳,質點可以反彈,每次碰到邊界顏色會隨著變化,完全實現了需求。gpt-4o-mini質點只是在某兩條邊種來回跳動,不會移動到其它的邊上也不會變換顏色。而grok只是繪制出了六邊形,但是質點卡在六邊形中不動。
模仿杜甫的《茅屋為秋風所破歌》的題材,改編一下李白《靜夜思》
從測試生成效果不難看出,Grok和Deepseek R1的效果最佳。 它們在任務理解的深度、創作質量的控制以及結果解釋的清晰度上都表現突出。gpt-4o-mini表現合格,完成了任務。
上面重點對比了DeepSeek-R1、Grok-3和gpt-4o,若要查看其他AI大模型對比情況包括Google Gemini,xAI,Deepseek,OpenAI等主流供應商。請點此查看完整報告或可以自己選擇期望的服務商制作比較報告