在測試數(shù)學(xué)能力的 AIME24 評測集上,以及評估代碼能力的 LiveCodeBench 中,千問 QwQ-32B 表現(xiàn)與 DeepSeek-R1-671B 相當(dāng),遠(yuǎn)勝于 OpenAI-o1-mini 及相同尺寸的 R1 蒸餾模型。在由 Meta 首席科學(xué)家楊立昆領(lǐng)銜的“最難 LLMs 評測榜” LiveBench、谷歌等提出的指令遵循能力 IFEval 評測集、由加州大學(xué)伯克利分校等提出的評估準(zhǔn)確調(diào)用函數(shù)或工具方面的 BFCL 測試中,千問 QwQ-32B 的得分均超越了 DeepSeek-R1-671B。

前置準(zhǔn)備

  1. 首次使用云原生應(yīng)用開發(fā)平臺(tái) CAP[1] 會(huì)自動(dòng)跳轉(zhuǎn)到訪問控制快速授權(quán)頁面,滾動(dòng)到瀏覽器底部單擊確認(rèn)授權(quán),等待授權(quán)結(jié)束后單擊返回控制臺(tái)。

  2. 本教程在函數(shù)計(jì)算中創(chuàng)建的 GPU 函數(shù),函數(shù)運(yùn)行使用的資源按照函數(shù)規(guī)格乘以執(zhí)行時(shí)長進(jìn)行計(jì)量,如果無請求調(diào)用,則只收取閑置預(yù)留模式下預(yù)置的快照費(fèi)用,CAP 中的極速模式通過預(yù)置實(shí)例快照實(shí)現(xiàn)毫秒級響應(yīng),其技術(shù)原理對應(yīng)函數(shù)計(jì)算的閑置預(yù)留模式,適用于需要快速冷啟動(dòng)的場景。建議您領(lǐng)取函數(shù)計(jì)算的試用額度 [2] 抵扣資源消耗,超出試用額度的部分將自動(dòng)轉(zhuǎn)為按量計(jì)費(fèi),更多計(jì)費(fèi)詳情,請參見計(jì)費(fèi)概述 [3]。

方式一:應(yīng)用模板部署

  1. 創(chuàng)建項(xiàng)目
    進(jìn)入 CAP 控制臺(tái) [4] 單擊基于模板創(chuàng)建開始創(chuàng)建。

    image

  2. 部署模板
    在搜索欄輸入 QWQ 進(jìn)行搜索,單擊基于 Qwen-QwQ 推理模型構(gòu)建 AI 聊天助手,進(jìn)入模板詳情頁,單擊立即部署。

    image

    image

    選擇地域,目前支持 北京、上海、杭州,單擊部署項(xiàng)目,在項(xiàng)目資源預(yù)覽對話框中,您可以看到相關(guān)的計(jì)費(fèi)項(xiàng),詳情請見計(jì)費(fèi)涉及的產(chǎn)品 [5]。單擊確認(rèn)部署,部署過程大約持續(xù) 10 分鐘左右,狀態(tài)顯示已部署表示部署成功。

    說明:選擇地域時(shí),一般是就近選擇地域信息,如果已經(jīng)開啟了 NAS 文件系統(tǒng),選擇手動(dòng)配置模型存儲(chǔ)時(shí),請選擇和文件系統(tǒng)相同的地域。如果您在測試調(diào)用的過程中遇到部署異常或模型拉取失敗,可能是當(dāng)前地域的 GPU 顯卡資源不足,建議您更換地域進(jìn)行重試。

    image

    image

  3. 驗(yàn)證應(yīng)用
    部署完畢后,點(diǎn)擊 Open-WebUI 服務(wù),在訪問地址內(nèi)找到公網(wǎng)訪問單擊訪問。在 OpenWebUI 界面體驗(yàn) QwQ 模型進(jìn)行對話。

    image

方式二:模型服務(wù)部署

使用 API 形式進(jìn)行模型調(diào)用,接入線上業(yè)務(wù)應(yīng)用。

  1. 創(chuàng)建空白項(xiàng)目
    進(jìn)入 CAP 控制臺(tái) [6] 單擊創(chuàng)建空白項(xiàng)目開始創(chuàng)建,并為項(xiàng)目命名。

    image

    image

  2. 選擇模型服務(wù)

    image

  3. 部署模型服務(wù)
    選擇模型 QwQ-32B-GGUF,目前僅支持杭州地域。

    image

    單擊資源配置,QwQ-32B-GGUF 推薦使用 Ada 系列,可直接使用默認(rèn)配置。您可以根據(jù)業(yè)務(wù)訴求填寫需要的卡型及規(guī)格信息。

    image

    單擊預(yù)覽并部署,在服務(wù)資源預(yù)覽對話框中,您可以看到相關(guān)的計(jì)費(fèi)項(xiàng),詳情請見計(jì)費(fèi)涉及的產(chǎn)品 [7]。單擊確認(rèn)部署,該階段需下載模型,預(yù)計(jì)等待 10~30 分鐘即可完成。

    image

    image

  4. 驗(yàn)證模型服務(wù)
    單擊調(diào)試,即可測試和驗(yàn)證相關(guān)模型調(diào)用。

    image

    image

    在本地命令行窗口中驗(yàn)證模型調(diào)用。

    image

  5. 第三方平臺(tái) API 調(diào)用
    您可以選擇在 Chatbox [8] 等其他第三方平臺(tái)中驗(yàn)證和應(yīng)用模型調(diào)用,以下以 Chatbox 為例。

    image

    image

刪除項(xiàng)目

您可以使用以下步驟刪除應(yīng)用,以降低產(chǎn)生的費(fèi)用。進(jìn)入項(xiàng)目詳情 > 點(diǎn)擊刪除,會(huì)進(jìn)入到刪除確認(rèn)對話框。

image

您可以看到要?jiǎng)h除的資源。默認(rèn)情況下,云原生應(yīng)用開發(fā)平臺(tái) CAP 會(huì)刪除項(xiàng)目下的所有服務(wù)。如果您希望保留資源,可以取消勾選指定的服務(wù),刪除項(xiàng)目時(shí)只會(huì)刪除勾選的服務(wù)。

image

勾選我已知曉:刪除該項(xiàng)目及選中的服務(wù)將立刻中斷其所服務(wù)的線上業(yè)務(wù),并且不可恢復(fù),同時(shí)將徹底刪除其所依賴的云產(chǎn)品資源,然后單擊確定刪除。

參考鏈接

原文轉(zhuǎn)載自:https://mp.weixin.qq.com/s/XrI02WSmKvV5od1Ery8HLQ

上一篇:

Cursor 和 Devbox 給我寫了個(gè)高仿蘋果官網(wǎng)

下一篇:

DeepSeek 全面指南,90% 的人都不知道的使用技巧
#你可能也喜歡這些API文章!

我們有何不同?

API服務(wù)商零注冊

多API并行試用

數(shù)據(jù)驅(qū)動(dòng)選型,提升決策效率

查看全部API→
??

熱門場景實(shí)測,選對API

#AI文本生成大模型API

對比大模型API的內(nèi)容創(chuàng)意新穎性、情感共鳴力、商業(yè)轉(zhuǎn)化潛力

25個(gè)渠道
一鍵對比試用API 限時(shí)免費(fèi)

#AI深度推理大模型API

對比大模型API的邏輯推理準(zhǔn)確性、分析深度、可視化建議合理性

10個(gè)渠道
一鍵對比試用API 限時(shí)免費(fèi)