DeepSeek 13個(gè)官方提示詞通俗解讀
2025/02/24
DeepSeek官方推出13類實(shí)用提示詞指南,覆蓋AI交互核心場(chǎng)景,如模型定制(生成Linux助手等)、角色扮演(沉浸對(duì)話)、文案/代碼生成(大綱、JSON結(jié)構(gòu)化)、翻譯優(yōu)化(信達(dá)雅標(biāo)準(zhǔn))、詩(shī)歌創(chuàng)作等,通過(guò)系統(tǒng)提示詞設(shè)定規(guī)則、用戶提示詞調(diào)整需求,支持合并輸入簡(jiǎn)化操作。適用于編程、營(yíng)銷、寫作等場(chǎng)景,結(jié)合案例與擴(kuò)展思路,幫助用戶精準(zhǔn)提問(wèn),提升AI輸出效率與實(shí)用性。
如何獲取字節(jié)火山deepseek系列-api完整教程,及使用方法
如何獲取字節(jié)火山deepseek系列-api完整教程,及使用方法
【AI驅(qū)動(dòng)】 API使用的幾種方式:飛書多維表格調(diào)用,Coze智能體調(diào)用,瀏覽器插件調(diào)用。
2025/02/24
阿里云PAI 支持云上一鍵部署 DeepSeek-V3、DeepSeek-R1 系列模型
阿里云PAI 支持云上一鍵部署 DeepSeek-V3、DeepSeek-R1 系列模型
【AI驅(qū)動(dòng)】 阿里云PAI平臺(tái)現(xiàn)已支持DeepSeek-V3和DeepSeek-R1系列模型的云上一鍵部署,助力企業(yè)用戶和開(kāi)發(fā)者實(shí)現(xiàn)模型與業(yè)務(wù)的高效融合。DeepSeek-V3是一個(gè)參數(shù)量達(dá)671B的MoE架構(gòu)大語(yǔ)言模型,采用MLA和DeepSeekMoE架構(gòu)優(yōu)化,支持多token預(yù)測(cè)訓(xùn)練目標(biāo),性能接近國(guó)際頂尖閉源模型。DeepSeek-R1則是高性能推理模型,參數(shù)量為660B,通過(guò)強(qiáng)化學(xué)習(xí)顯著提升推理能力。PAI Model Gallery集成了包括DeepSeek系列在內(nèi)的多種預(yù)訓(xùn)練模型,用戶可零代碼完成從訓(xùn)練到部署的全流程。部署方式包括vLLM加速部署和Web應(yīng)用部署,支持多種推理框架,部署后可快速獲取調(diào)用接口,實(shí)現(xiàn)模型的高效應(yīng)用。
2025/02/21
微調(diào)碾壓RAG?大模型意圖識(shí)別工程化實(shí)踐
微調(diào)碾壓RAG?大模型意圖識(shí)別工程化實(shí)踐
【AI驅(qū)動(dòng)】 文章探討了大模型在智能電視意圖識(shí)別中的應(yīng)用與工程化實(shí)踐,對(duì)比了基礎(chǔ)模型、RAG(檢索增強(qiáng)生成)和微調(diào)模型三種方案的優(yōu)缺點(diǎn)。智能電視行業(yè)正借助AI大模型的自然語(yǔ)言處理和邏輯推理能力提升用戶體驗(yàn),但傳統(tǒng)NLP算法在復(fù)雜語(yǔ)境下的意圖識(shí)別、上下文理解和多輪對(duì)話方面存在局限性。文章詳細(xì)介紹了三種方案的特點(diǎn)、模型選擇、實(shí)現(xiàn)方法及優(yōu)缺點(diǎn):方案一(基礎(chǔ)模型+Prompt)開(kāi)發(fā)成本低,但對(duì)垂類領(lǐng)域分類識(shí)別能力有限;方案二(基礎(chǔ)模型+Prompt+RAG)通過(guò)知識(shí)庫(kù)增強(qiáng)意圖分類能力,但存在延遲和幻覺(jué)問(wèn)題;方案三(小尺寸模型微調(diào))通過(guò)LoRA微調(diào)解決延遲問(wèn)題,同時(shí)利用微調(diào)提升數(shù)據(jù)增強(qiáng)效果。最終,作者選擇了7B底座的微調(diào)方案,并通過(guò)自動(dòng)質(zhì)檢和自動(dòng)微調(diào)工程鏈路實(shí)現(xiàn)生產(chǎn)準(zhǔn)確率的持續(xù)優(yōu)化。該方案在某國(guó)產(chǎn)頭部電視廠家落地后,平均延遲500ms,實(shí)時(shí)準(zhǔn)確率達(dá)到98%以上,顯著提升了用戶體驗(yàn)。
2025/02/21
0代碼!2種方式一鍵部署 DeepSeek 系列模型
0代碼!2種方式一鍵部署 DeepSeek 系列模型
【AI驅(qū)動(dòng)】 本文介紹了如何通過(guò)阿里云的函數(shù)計(jì)算(FC)和云原生應(yīng)用開(kāi)發(fā)平臺(tái)(CAP)以零代碼、低門檻的方式一鍵部署DeepSeek-R1系列模型。文章以DeepSeek-R1-Distill-Qwen-7B-GGUF模型為例,展示了兩種部署方式:模型服務(wù)部署和應(yīng)用模板部署。模型服務(wù)部署通過(guò)API調(diào)用接入線上業(yè)務(wù)應(yīng)用,支持Ollama和Transformers框架,用戶可快速配置資源并完成模型部署,最快10分鐘即可完成。應(yīng)用模板部署則實(shí)現(xiàn)DeepSeek-R1模型與OpenWebUI的結(jié)合,用戶可通過(guò)OpenWebUI界面直接與模型對(duì)話。該方案采用按量付費(fèi)模式,支持彈性伸縮和高可用性,適合希望快速部署、無(wú)需關(guān)注運(yùn)維的用戶。
2025/02/21
云端部署DeepSeek操作指南
云端部署DeepSeek操作指南
【AI驅(qū)動(dòng)】 本文介紹了如何將DeepSeek-R1開(kāi)源模型部署到GPU云服務(wù)器,并在服務(wù)器上安裝配置Ollama和Open WebUI。文章首先指出,云端部署DeepSeek模型具有部署效率高、成本優(yōu)化和創(chuàng)新資源豐富等優(yōu)勢(shì)。接著,文章詳細(xì)說(shuō)明了部署過(guò)程,包括創(chuàng)建專有網(wǎng)絡(luò)VPC和交換機(jī)、配置安全組、創(chuàng)建GPU云服務(wù)器實(shí)例等環(huán)境準(zhǔn)備工作,以及通過(guò)Ollama框架部署模型和使用Open WebUI調(diào)用模型服務(wù)的具體步驟。最后,文章還提供了應(yīng)用體驗(yàn)指南,包括如何訪問(wèn)示例應(yīng)用、與模型進(jìn)行對(duì)話交互,以及如何通過(guò)Chatbox客戶端配置Ollama API進(jìn)行對(duì)話。
2025/02/21
如何在IDE里使用DeepSeek-V3 和 DeepSeek-R1 滿血版模型
如何在IDE里使用DeepSeek-V3 和 DeepSeek-R1 滿血版模型
【AI驅(qū)動(dòng)】 本文介紹了如何在IDE中使用DeepSeek-V3和DeepSeek-R1滿血版模型,以及通義靈碼的最新功能升級(jí)。通義靈碼支持VS Code、JetBrains IDEs等多種開(kāi)發(fā)環(huán)境,用戶可通過(guò)插件市場(chǎng)或官網(wǎng)下載安裝,并在IDE中切換使用Qwen 2.5、DeepSeek-V3、DeepSeek-R1等模型,以實(shí)現(xiàn)代碼生成、智能補(bǔ)全、代碼優(yōu)化等功能。文章詳細(xì)說(shuō)明了在JetBrains IDEs和VS Code中安裝通義靈碼的步驟,并介紹了其核心能力,包括行級(jí)/函數(shù)級(jí)實(shí)時(shí)補(bǔ)全、自然語(yǔ)言生成代碼、企業(yè)代碼生成增強(qiáng)、智能問(wèn)答以及AI程序員的多文件代碼修改和單元測(cè)試生成等功能。通過(guò)這些功能,開(kāi)發(fā)者可以在IDE中高效完成復(fù)雜編碼任務(wù),提升編程效率和代碼質(zhì)量。
2025/02/21
破解 vLLM + DeepSeek 規(guī)模化部署的“不可能三角”
破解 vLLM + DeepSeek 規(guī)模化部署的“不可能三角”
【AI驅(qū)動(dòng)】 文章介紹了如何通過(guò)阿里云函數(shù)計(jì)算(FC)的GPU預(yù)留實(shí)例閑置計(jì)費(fèi)功能,破解vLLM和DeepSeek規(guī)模化部署中的“不可能三角”問(wèn)題,即性能、成本與穩(wěn)定性的平衡。文章指出,vLLM和DeepSeek等大語(yǔ)言模型在規(guī)模化部署時(shí)面臨諸多挑戰(zhàn),包括大規(guī)模參數(shù)量導(dǎo)致的啟動(dòng)和加載問(wèn)題、高效推理能力要求、上下文理解的連貫性需求,以及顯卡資源利用率、成本控制等難題。FC通過(guò)預(yù)先啟動(dòng)服務(wù)實(shí)例、靈活計(jì)費(fèi)模式和自主研發(fā)調(diào)度算法等方式,優(yōu)化了性能、降低了成本、保障了穩(wěn)定性。同時(shí),F(xiàn)C還支持高效的開(kāi)發(fā)與運(yùn)維能力,提供多種請(qǐng)求導(dǎo)入機(jī)制和簡(jiǎn)便的部署流程,使得企業(yè)可以專注于業(yè)務(wù)邏輯創(chuàng)新。
2025/02/21
大模型推理服務(wù)全景圖
大模型推理服務(wù)全景圖
【AI驅(qū)動(dòng)】 本文從技術(shù)架構(gòu)的全局視角出發(fā),詳細(xì)剖析了大模型推理服務(wù)的全景圖。文章指出,隨著 DeepSeek R1 和 Qwen2.5-Max 等大模型的發(fā)布,推理性能成為優(yōu)化的關(guān)鍵領(lǐng)域,其提升涉及芯片層、編程語(yǔ)言層、深度學(xué)習(xí)框架層、推理加速層、大模型層、計(jì)算平臺(tái)層、應(yīng)用編排層和流量管理層等多個(gè)技術(shù)層級(jí)的協(xié)同優(yōu)化。文章逐一介紹了各層級(jí)的關(guān)鍵技術(shù)和代表性方案,如芯片層的 NVIDIA、AMD 和國(guó)內(nèi)的平頭哥、華為 Ascend;推理加速層的 vLLM、TensorRT-LLM 和阿里云的 BladeLLM;以及流量管理層的 Higress 和阿里云云原生 API 網(wǎng)關(guān)等。通過(guò)這些內(nèi)容,文章展示了大模型推理服務(wù)的全貌,并強(qiáng)調(diào)了各層級(jí)優(yōu)化對(duì)提升推理性能、降低成本和改善用戶體驗(yàn)的重要性。
2025/02/20
在 Claude 上復(fù)刻 DeepSeek-R1 效果
在 Claude 上復(fù)刻 DeepSeek-R1 效果
【AI驅(qū)動(dòng)】 本文講述了作者通過(guò)提示詞工程在 Claude 上“復(fù)刻”DeepSeek-R1 使用效果的過(guò)程。作者首先介紹了 DeepSeek-R1 的特點(diǎn),包括其在復(fù)雜推理任務(wù)中的卓越表現(xiàn)以及公開(kāi)的深度思考過(guò)程。為了在 Claude 上實(shí)現(xiàn)類似效果,作者嘗試通過(guò)調(diào)整提示詞,讓模型先輸出推理過(guò)程再給出結(jié)論,并通過(guò)結(jié)構(gòu)化標(biāo)簽展示思考過(guò)程。經(jīng)過(guò)多次優(yōu)化,最終成功模擬出 DeepSeek-R1 的深度思考框架,提升了 Claude 3.5 Sonnet 的表現(xiàn)。這一過(guò)程不僅實(shí)現(xiàn)了在 Claude 上復(fù)刻 DeepSeek-R1 效果的目標(biāo),還展示了提示詞工程在優(yōu)化大模型輸出中的重要作用,同時(shí)為用戶提供了更透明化的推理過(guò)程和更個(gè)性化的使用體驗(yàn)。
2025/02/20
基于LLM打造沉浸式3D世界
基于LLM打造沉浸式3D世界
【AI驅(qū)動(dòng)】 利用大型語(yǔ)言模型(LLM)結(jié)合虛幻引擎,通過(guò)視覺(jué)-語(yǔ)言模型(VLMs)為3D模型生成自然語(yǔ)言描述,建立模型的語(yǔ)義信息,使其能夠被LLM理解和處理。同時(shí),借助場(chǎng)景級(jí)標(biāo)注和多種策略建立文本描述與場(chǎng)景內(nèi)實(shí)體的映射關(guān)系,幫助LLM理解3D場(chǎng)景。通過(guò)FunctionCall將LLM的輸出轉(zhuǎn)化為實(shí)際操作,實(shí)現(xiàn)自然語(yǔ)言指令對(duì)3D世界的交互,如移動(dòng)物體或調(diào)整場(chǎng)景布局。這一研究展示了LLM在3D領(lǐng)域的巨大潛力,為自動(dòng)駕駛、具身智能和3D生成等方向提供了新的思路和方法。
2025/02/20
如何獲取 Grok3 API 密鑰(分步指南)
如何獲取 Grok3 API 密鑰(分步指南)
【AI驅(qū)動(dòng)】 在人工智能和自然語(yǔ)言處理領(lǐng)域,精準(zhǔn)的智能助手和語(yǔ)言理解能力至關(guān)重要。Grok3 API為開(kāi)發(fā)者提供了強(qiáng)大的工具,可以輕松集成先進(jìn)的對(duì)話式AI功能,幫助提升應(yīng)用的智能化水平。通過(guò)使用該API,開(kāi)發(fā)者能夠?qū)崿F(xiàn)自然語(yǔ)言理解、智能對(duì)話和個(gè)性化推薦等...
2025/02/20
漫談DeepSeek及其背后的核心技術(shù)
漫談DeepSeek及其背后的核心技術(shù)
【AI驅(qū)動(dòng)】 本文深入探討了DeepSeek大模型的核心技術(shù),從公司背景、模型能力、訓(xùn)練與推理成本到核心技術(shù)細(xì)節(jié)進(jìn)行了全面分析。DeepSeek由幻方量化于2023年7月在杭州成立,其推出的V3模型在性能上已與OpenAI的GPT-4o媲美,訓(xùn)練成本不到600萬(wàn)美元,API定價(jià)遠(yuǎn)低于國(guó)內(nèi)其他頭部廠商。DeepSeek-V3采用了自研的MLA(多頭潛在注意力)機(jī)制和無(wú)輔助損失的MoE(Mixture of Experts)架構(gòu),顯著減少了KV緩存和訓(xùn)練成本。訓(xùn)練框架HAI-LLM支持多種并行策略,優(yōu)化了通信和計(jì)算效率。推理部署采用預(yù)填充和解碼分離策略,確保高吞吐量和低延遲。文章還指出,DeepSeek的成功在于其深厚的技術(shù)積累和對(duì)基礎(chǔ)研究的重視,其技術(shù)創(chuàng)新將推動(dòng)AI行業(yè)的快速且低成本迭代。
2025/02/20
如何讓AI生成的文本更有人味
如何讓AI生成的文本更有人味
【AI驅(qū)動(dòng)】 在現(xiàn)代社會(huì),AI文本人性化是一個(gè)備受關(guān)注的話題。隨著人工智能技術(shù)的不斷進(jìn)步,如何讓AI生成的文本更加貼近人類的表達(dá)方式成為研究的重點(diǎn)。AI文本人性化不僅涉及到語(yǔ)義理解和自然語(yǔ)言生成,還包括情感分析和語(yǔ)境推理等方面。通過(guò)不斷優(yōu)化算法和數(shù)據(jù)訓(xùn)練,AI可以生成更為自然流暢的文字,使其在各類應(yīng)用中更具實(shí)用性和親和力。
2025/02/20
Grok 3 平臺(tái)介紹:xAI 人工智能新紀(jì)元的引領(lǐng)者
Grok 3 平臺(tái)介紹:xAI 人工智能新紀(jì)元的引領(lǐng)者
【AI驅(qū)動(dòng)】 Grok 3 平臺(tái)是 xAI 最新推出的大語(yǔ)言模型,憑借混合專家架構(gòu)和“思維鏈”推理機(jī)制,展現(xiàn)出強(qiáng)大的推理能力、多模態(tài)處理能力和實(shí)時(shí)信息整合功能。其總參數(shù)量達(dá) 1.2 萬(wàn)億,依托 Colossus 超級(jí)計(jì)算機(jī)和高質(zhì)量數(shù)據(jù)訓(xùn)練,在行業(yè)基準(zhǔn)測(cè)試中表現(xiàn)卓越,尤其在數(shù)學(xué)推理和科學(xué)知識(shí)領(lǐng)域領(lǐng)先。Grok 3 平臺(tái)集成了 DeepSearch 智能搜索引擎,支持跨領(lǐng)域應(yīng)用,包括科研、教育、醫(yī)療和企業(yè)服務(wù),并為用戶提供透明、邏輯清晰的回答。盡管目前仍處于 Beta 階段,未來(lái)計(jì)劃通過(guò) API 服務(wù)和語(yǔ)音功能進(jìn)一步擴(kuò)展其潛力,標(biāo)志著人工智能發(fā)展的新紀(jì)元。
2025/02/19
Elon Musk AI 的人工智能項(xiàng)目:Grok 3 的技術(shù)突破與未來(lái)展望
Elon Musk AI 的人工智能項(xiàng)目:Grok 3 的技術(shù)突破與未來(lái)展望
【AI驅(qū)動(dòng)】 Elon Musk AI 的人工智能項(xiàng)目 Grok 3 是 Musk 領(lǐng)導(dǎo)的 xAI 公司推出的最新成果,旨在通過(guò)強(qiáng)大的推理能力和優(yōu)化的算法超越現(xiàn)有的 AI 模型。Grok 3 在數(shù)學(xué)、科學(xué)和編程基準(zhǔn)測(cè)試中表現(xiàn)出色,尤其在復(fù)雜推理和搜索功能方面具有顯著優(yōu)勢(shì)。其功能亮點(diǎn)包括深度搜索、在線編程支持和復(fù)雜推理模式,能夠滿足個(gè)人用戶和企業(yè)客戶的需求。Grok 3 的價(jià)格定位較高,每月 40 美元的訂閱費(fèi)用反映了其高端市場(chǎng)定位。與市場(chǎng)上其他主要 AI 模型相比,Grok 3 在性能上具有明顯優(yōu)勢(shì),尤其是在處理復(fù)雜任務(wù)時(shí)。隨著語(yǔ)音模式的推出和未來(lái)代碼的開(kāi)源,Grok 3 有望進(jìn)一步推動(dòng)人工智能技術(shù)的發(fā)展,為用戶提供更高效、更智能的服務(wù)。
2025/02/19
1 7 8 9 10 11 63
搜索、試用、集成國(guó)內(nèi)外API!
冪簡(jiǎn)集成API平臺(tái)已有 5002種API!
API大全
搜索文章
熱門話題
文章精選
na
大模型上下文協(xié)議與Spring開(kāi)發(fā)集成篇——mcp-spring-webmvc原理
na
從零開(kāi)始教你打造一個(gè)MCP客戶端
na
一文講透 AI Agent 與 AI Workflow 的區(qū)別和深度解析:從自動(dòng)化到智能化的演進(jìn)
na
實(shí)測(cè)告訴你:DeepSeek-R1 7B、32B、671B差距有多大
na
6個(gè)大模型的核心技術(shù)介紹
na
太強(qiáng)了!各個(gè)行業(yè)的AI大模型!金融、教育、醫(yī)療、法律
na
在Sealos 平臺(tái)的幫助下一個(gè)人維護(hù)著 6000 個(gè)數(shù)據(jù)庫(kù)