
IT咨詢顧問的關(guān)鍵抓手-DeepSeek+企業(yè)架構(gòu)-快速的熟悉和洞察一個(gè)新的行業(yè)
在測試數(shù)學(xué)能力的 AIME24 評測集上,以及評估代碼能力的 LiveCodeBench 中,千問 QwQ-32B 表現(xiàn)與 DeepSeek-R1-671B 相當(dāng),遠(yuǎn)勝于 OpenAI-o1-mini 及相同尺寸的 R1 蒸餾模型。在由 Meta 首席科學(xué)家楊立昆領(lǐng)銜的“最難 LLMs 評測榜” LiveBench、谷歌等提出的指令遵循能力 IFEval 評測集、由加州大學(xué)伯克利分校等提出的評估準(zhǔn)確調(diào)用函數(shù)或工具方面的 BFCL 測試中,千問 QwQ-32B 的得分均超越了 DeepSeek-R1-671B。
首次使用云原生應(yīng)用開發(fā)平臺(tái) CAP[1] 會(huì)自動(dòng)跳轉(zhuǎn)到訪問控制快速授權(quán)頁面,滾動(dòng)到瀏覽器底部單擊確認(rèn)授權(quán),等待授權(quán)結(jié)束后單擊返回控制臺(tái)。
本教程在函數(shù)計(jì)算中創(chuàng)建的 GPU 函數(shù),函數(shù)運(yùn)行使用的資源按照函數(shù)規(guī)格乘以執(zhí)行時(shí)長進(jìn)行計(jì)量,如果無請求調(diào)用,則只收取閑置預(yù)留模式下預(yù)置的快照費(fèi)用,CAP 中的極速模式通過預(yù)置實(shí)例快照實(shí)現(xiàn)毫秒級響應(yīng),其技術(shù)原理對應(yīng)函數(shù)計(jì)算的閑置預(yù)留模式,適用于需要快速冷啟動(dòng)的場景。建議您領(lǐng)取函數(shù)計(jì)算的試用額度 [2] 抵扣資源消耗,超出試用額度的部分將自動(dòng)轉(zhuǎn)為按量計(jì)費(fèi),更多計(jì)費(fèi)詳情,請參見計(jì)費(fèi)概述 [3]。
創(chuàng)建項(xiàng)目
進(jìn)入 CAP 控制臺(tái) [4] 單擊基于模板創(chuàng)建開始創(chuàng)建。
部署模板
在搜索欄輸入 QWQ 進(jìn)行搜索,單擊基于 Qwen-QwQ 推理模型構(gòu)建 AI 聊天助手,進(jìn)入模板詳情頁,單擊立即部署。
選擇地域,目前支持 北京、上海、杭州,單擊部署項(xiàng)目,在項(xiàng)目資源預(yù)覽對話框中,您可以看到相關(guān)的計(jì)費(fèi)項(xiàng),詳情請見計(jì)費(fèi)涉及的產(chǎn)品 [5]。單擊確認(rèn)部署,部署過程大約持續(xù) 10 分鐘左右,狀態(tài)顯示已部署表示部署成功。
說明:選擇地域時(shí),一般是就近選擇地域信息,如果已經(jīng)開啟了 NAS 文件系統(tǒng),選擇手動(dòng)配置模型存儲(chǔ)時(shí),請選擇和文件系統(tǒng)相同的地域。如果您在測試調(diào)用的過程中遇到部署異常或模型拉取失敗,可能是當(dāng)前地域的 GPU 顯卡資源不足,建議您更換地域進(jìn)行重試。
驗(yàn)證應(yīng)用
部署完畢后,點(diǎn)擊 Open-WebUI 服務(wù),在訪問地址內(nèi)找到公網(wǎng)訪問單擊訪問。在 OpenWebUI 界面體驗(yàn) QwQ 模型進(jìn)行對話。
使用 API 形式進(jìn)行模型調(diào)用,接入線上業(yè)務(wù)應(yīng)用。
創(chuàng)建空白項(xiàng)目
進(jìn)入 CAP 控制臺(tái) [6] 單擊創(chuàng)建空白項(xiàng)目開始創(chuàng)建,并為項(xiàng)目命名。
選擇模型服務(wù)
部署模型服務(wù)
選擇模型 QwQ-32B-GGUF,目前僅支持杭州地域。
單擊資源配置,QwQ-32B-GGUF 推薦使用 Ada 系列,可直接使用默認(rèn)配置。您可以根據(jù)業(yè)務(wù)訴求填寫需要的卡型及規(guī)格信息。
單擊預(yù)覽并部署,在服務(wù)資源預(yù)覽對話框中,您可以看到相關(guān)的計(jì)費(fèi)項(xiàng),詳情請見計(jì)費(fèi)涉及的產(chǎn)品 [7]。單擊確認(rèn)部署,該階段需下載模型,預(yù)計(jì)等待 10~30 分鐘即可完成。
驗(yàn)證模型服務(wù)
單擊調(diào)試,即可測試和驗(yàn)證相關(guān)模型調(diào)用。
在本地命令行窗口中驗(yàn)證模型調(diào)用。
第三方平臺(tái) API 調(diào)用
您可以選擇在 Chatbox [8] 等其他第三方平臺(tái)中驗(yàn)證和應(yīng)用模型調(diào)用,以下以 Chatbox 為例。
您可以使用以下步驟刪除應(yīng)用,以降低產(chǎn)生的費(fèi)用。進(jìn)入項(xiàng)目詳情 > 點(diǎn)擊刪除,會(huì)進(jìn)入到刪除確認(rèn)對話框。
您可以看到要?jiǎng)h除的資源。默認(rèn)情況下,云原生應(yīng)用開發(fā)平臺(tái) CAP 會(huì)刪除項(xiàng)目下的所有服務(wù)。如果您希望保留資源,可以取消勾選指定的服務(wù),刪除項(xiàng)目時(shí)只會(huì)刪除勾選的服務(wù)。
勾選我已知曉:刪除該項(xiàng)目及選中的服務(wù)將立刻中斷其所服務(wù)的線上業(yè)務(wù),并且不可恢復(fù),同時(shí)將徹底刪除其所依賴的云產(chǎn)品資源,然后單擊確定刪除。
原文轉(zhuǎn)載自:https://mp.weixin.qq.com/s/XrI02WSmKvV5od1Ery8HLQ
IT咨詢顧問的關(guān)鍵抓手-DeepSeek+企業(yè)架構(gòu)-快速的熟悉和洞察一個(gè)新的行業(yè)
基于Ollama與AnythingLLM的DeepSeek-R1本地RAG應(yīng)用實(shí)踐
模型引擎的技術(shù)債務(wù)?一個(gè)Deepseek三種API引發(fā)的連鎖反應(yīng)
Windows 上快速部署.NET Core Web 項(xiàng)目
.NET開發(fā)者看過來!DeepSeek SDK 集成
LangChain4j實(shí)戰(zhàn)-Java AI應(yīng)用開源框架之LangChain4j和Spring AI
后端開發(fā)人員Docker快速入門
生產(chǎn)級滿血版Deepseek-r1 671B部署實(shí)例
生產(chǎn)級滿血版Deepseek-r1 671B部署后續(xù)問題、調(diào)優(yōu)以及壓測