
性能優(yōu)化必讀:API性能測試的步驟和工具
2API Keys頁面:從左側(cè)導航欄中找到API Keys頁面,賬號中的所有API Key都會在這里顯示
3.創(chuàng)建API key:點擊左側(cè)導航欄APIkeys > 創(chuàng)建API key
4.查看API key:創(chuàng)建以后會顯示API Key(注意:復制保存好API key,因為出于安全原因,你將無法通過 API keys 管理界面再次查看它)
在獲取API key后,進行可用性測試是確保其正常工作的重要步驟。以下是使用CURL進行測試的一個案例:
輸入:
curl -X POST https://api.deepseek.com/chat/completions \
-H "Content-Type: application/json" \
-H "Authorization: Bearer <DeepSeek API Key>" \
-d '{
"model": "deepseek-chat",
"messages": [
{"role": "user", "content": "你好!"}
],
"stream": false
}'
輸出:
你將得到一個JSON格式的響應,其中包含了詳細信息,如當前對話的模型輸出內(nèi)容、模型名稱、用戶輸入的token數(shù)量、模型輸出的token數(shù)量等。
示例輸出:
{
"id": "6fb162c4-7305-487e-9fad-72a0f92dca0c",
"object": "chat.completion",
"created": 1730969963,
"model": "deepseek-chat",
"choices": [
{
"index": 0,
"message": {
"role": "assistant",
"content": "你好!很高興見到你。有什么我可以幫忙的嗎?"
},
"logprobs": null,
"finish_reason": "stop"
}
],
"usage": {
"prompt_tokens": 11,
"completion_tokens": 13,
"total_tokens": 24,
"prompt_cache_hit_tokens": 0,
"prompt_cache_miss_tokens": 11
},
"system_fingerprint": "fp_1c141eb703"
}
在使用Deepseek API搭建應用時,除了獲取和測試API key外,還需考慮以下因素:
模型(1) | 上下文長度 | 最大輸出長度(2) | 輸入價格 (緩存命中)(3) | 輸入價格 (緩存未命中) | 輸出價格 |
---|---|---|---|---|---|
deepseek-chat | 128K | 4K (8KBeta) | 0.1元/百萬tokens | 1元/百萬tokens | 2元/百萬tokens |
token 是模型用來表示自然語言文本的基本單位,也是我們的計費單元,可以直觀的理解為“字”或“詞”;通常 1 個中文詞語、1 個英文單詞、1 個數(shù)字或 1 個符號計為 1 個 token。
一般情況下模型中 token 和字數(shù)的換算比例大致如下:
但因為不同模型的分詞不同,所以換算比例也存在差異,每一次實際處理 token 數(shù)量以模型返回為準,您可以從返回結(jié)果的 usage
中查看。
扣減費用 = token 消耗量 × 模型單價,對應的費用將直接從充值余額或贈送余額中進行扣減。 當充值余額與贈送余額同時存在時,優(yōu)先扣減贈送余額。
DeepSeek API 不限制用戶并發(fā)量,我們會盡力保證您所有請求的服務質(zhì)量。
但請注意,當我們的服務器承受高流量壓力時,您可能會收到 429(請求速率達到上限)或 503(服務器繁忙)的錯誤。當這種情況發(fā)生時,請稍等片刻再重試。如果這種情況一直存在,請聯(lián)系我們進行處理。
您在調(diào)用 DeepSeek API 時,可能會遇到以下錯誤。這里列出了相關錯誤的原因及其解決方法。
錯誤碼 | 描述 |
---|---|
400 – 格式錯誤 | 原因:請求體格式錯誤 解決方法:請根據(jù)錯誤信息提示修改請求體 |
401 – 認證失敗 | 原因:API key 錯誤,認證失敗 解決方法:請檢查您的 API key 是否正確,如沒有 API key,請先 創(chuàng)建 API key |
402 – 余額不足 | 原因:賬號余額不足 解決方法:請確認賬戶余額,并前往 充值 頁面進行充值 |
422 – 參數(shù)錯誤 | 原因:請求體參數(shù)錯誤 解決方法:請根據(jù)錯誤信息提示修改相關參數(shù) |
429 – 請求速率達到上限 | 原因:請求速率(TPM 或 RPM)達到上限 解決方法:請合理規(guī)劃您的請求速率。 |
500 – 服務器故障 | 原因:服務器內(nèi)部故障 解決方法:請等待后重試。若問題一直存在,請聯(lián)系我們解決 |
503 – 服務器繁忙 | 原因:服務器負載過高 解決方法:請稍后重試您的請求 |
在申請和使用 Deepseek API key過程中,你可能會遇到以下常見問題:
1. 調(diào)用模型時的并發(fā)限制是多少?是否可以提高賬號的并發(fā)上限?
當前階段,我們沒有按照用戶設置硬性并發(fā)上限。在系統(tǒng)總負載量較高時,基于系統(tǒng)負載和用戶短時歷史用量的動態(tài)限流模型可能會導致用戶收到 503 或 429 錯誤碼。
目前暫不支持針對單個賬號提高并發(fā)上限,感謝您的理解。
2. 為什么我感覺 API 返回比網(wǎng)頁端慢?
網(wǎng)頁端默認使用流式輸出(stream=true),即模型每輸出一個字符,都會增量地顯示在前端。
API 默認使用非流式輸出(stream=false),即模型在所有內(nèi)容輸出完后,才會返回給用戶。您可以通過開啟 API 的 stream 模式來提升交互性。
3.是否支持 LangChain?
支持。LangChain 支持 OpenAI API 接口,而 DeepSeek API 接口與 OpenAI 兼容。您可以下載以下代碼文件并替換代碼中的 API Key,實現(xiàn)在 LangChain 中調(diào)用 DeepSeek API。
4.為什么我的賬號無法登陸?
您賬號近期的行為可能觸發(fā)了我們的自動化風控策略,導致我們暫時關閉了您對賬號的訪問權(quán)限。如需申訴,請?zhí)顚憜柧恚覀儠M快處理。
在獲得Deepseek API Key之后,即可開啟API接口對接,本文整理了多篇使用Deepseek API的案例,幫助讀者更有效地使用Deepseek API:
問題1: 什么是冪簡集成平臺?
冪簡集成是蜜堂有信在2023年打造的一款SAAS產(chǎn)品,建設著國內(nèi)最全的API平臺,為開發(fā)者提供全面、高效、易用的API集成管理方案,一站搜索、試用、集成國內(nèi)和國外API。讓用戶在AI時代全方位接入互聯(lián)網(wǎng),用API連接一切服務和算力,實現(xiàn)價值倍增。
問題2:如何找到Deepseek API
冪簡API平臺可以通過以下兩種方式找到所需API:通過關鍵詞搜索API(例如,輸入’Deepseek API‘這類品類詞,更容易找到結(jié)果)、或者從API hub分類頁進入尋找。
問題3:Deepseek API的替代品有哪些?
市場上存在免費、付費兩種替代者
例如
更多競品可以在Deepseek開放平臺找到。
在獲取并使用 Deepseek API Key的過程中,本文提供了詳盡的操作步驟和關鍵提示,幫助開發(fā)者順利完成秘鑰申請、功能測試、及后續(xù)的使用。通過 Deepseek API,開發(fā)者可以輕松實現(xiàn)智能數(shù)據(jù)處理和集成服務,提升業(yè)務的智能化水平。此外,本文還詳細介紹了在使用過程中需要注意的模型定價、錯誤處理和并發(fā)限制等因素,幫助開發(fā)者更好地掌控成本和優(yōu)化用戶體驗。
更多相關文章: