接入模型表單字段詳細(xì)說明

參數(shù)名稱參數(shù)說明
接入點(diǎn)名稱填寫接入點(diǎn)名稱
接入點(diǎn)描述描述接入模型的業(yè)務(wù)需求,如接入場景、用途(如測試、線上業(yè)務(wù))等
接入模型可選擇【模型廣場】或【精調(diào)模型】中的模型進(jìn)行接入選擇【模型廣場】中的模型后,需進(jìn)一步選擇模型版本選擇【精調(diào)模型】中的模型后,需進(jìn)一步選擇模型版本和 Checkpoint。當(dāng)前僅支持基于豆包系列模型進(jìn)行精調(diào)的模型
購買方式– 支持使用【按Token付費(fèi)】、【按模型單元付費(fèi)】2種模式

模型單元

什么是模型單元

模型單元是調(diào)用某個特定模型的 TPM(Token per Minite)配額。創(chuàng)建推理接入點(diǎn)選擇按模型單元付費(fèi)后,用戶可以獲得比按 Token 付費(fèi)更大的并發(fā)量,且無需再為 Token 消耗付費(fèi)。模型單元付費(fèi)方式為預(yù)付費(fèi)。

建議購買模型單元場景

支持模型單元的模型

我們對Doubao系列模型與部分開源模型支持模型單元。支持范圍請參考產(chǎn)品計(jì)費(fèi)

使用說明

目前支持在+ 創(chuàng)建推理接入 點(diǎn)配置算力保障時,進(jìn)行購買模型單元,可以配置購買模型單元的數(shù)量、時長、是否自動續(xù)費(fèi)。自動續(xù)費(fèi)支持按照單次自動續(xù)費(fèi)時長(按天)及自動續(xù)費(fèi)次數(shù)(永久生效、自定義次數(shù))自定義配置。

  1. 當(dāng)前模型單元僅支持申請使用,如您希望使用模型單元,可參照前端提示提交工單,系統(tǒng)審批后可進(jìn)行購買及數(shù)量配置。
  2. 預(yù)付費(fèi) TPM 配額到期自動終止,為避免續(xù)費(fèi)不及時導(dǎo)致業(yè)務(wù)中斷,建議開通自動續(xù)費(fèi)。
  3. 超過模型單元覆蓋的 TPM 配額的需求將被拒絕,如您有預(yù)期外的流量尖峰,您可以通過模型單元疊加按 Token 計(jì)費(fèi)的模型推理接入點(diǎn)2種方式來支撐。

計(jì)費(fèi)

  1. 使用模型單元創(chuàng)建完成的模型推理接入點(diǎn),支持對模型單元進(jìn)行增減購買、到期續(xù)費(fèi)配置調(diào)整。7天內(nèi)到期的模型單元會出現(xiàn)到期提醒。
  1. 模型單元計(jì)費(fèi)會根據(jù)實(shí)際使用的模型單元數(shù)量、時長進(jìn)行計(jì)費(fèi)。因?yàn)槭穷A(yù)付費(fèi),因此如果進(jìn)行擴(kuò)縮容的操作,也會對應(yīng)有補(bǔ)款和退款。
  2. 模型單元到期提醒
  3. 模型單元到期時間說明
  1. 模型單元調(diào)整、續(xù)費(fèi)、退訂

通過【模型推理】列表頁,找到需要調(diào)整的接入點(diǎn),點(diǎn)擊右側(cè)的 ··· 可以進(jìn)行調(diào)整模型單元、續(xù)費(fèi)、退訂。

點(diǎn)擊續(xù)費(fèi)按鈕,會跳轉(zhuǎn)到費(fèi)用中心的續(xù)費(fèi)管理頁面,可以進(jìn)行續(xù)費(fèi)操作

  1. 模型單元退訂

想要刪除買了模型單元的接入點(diǎn),需要到費(fèi)用中心退訂管理中操作模型單元退訂,退訂成功后,再進(jìn)行接入點(diǎn)的刪除操作。

注意:因?yàn)槟P蛦卧前磳?shí)例組購買的,點(diǎn)擊接入點(diǎn)名稱詳情中復(fù)制的模型單元ID是實(shí)例組 ID,實(shí)例組存在強(qiáng)綁定關(guān)系,因此續(xù)費(fèi)、退訂須同步發(fā)起。請注意,未到期的模型單元退訂會產(chǎn)生懲罰系數(shù),無法100%退費(fèi)。

獲取API Key

進(jìn)入 API Key 管理 頁面,選擇需要的項(xiàng)目,點(diǎn)擊 創(chuàng)建 API Key,即可生成長效 API Key。all權(quán)限默認(rèn)給予項(xiàng)目下所有模型接入點(diǎn)和智能體訪問權(quán)限。

四、基于SDK開發(fā)

4.1 Maven引入SDK

<dependency>
<groupId>com.volcengine</groupId>
<artifactId>volcengine-java-sdk-ark-runtime</artifactId>
<version>LATEST</version>
</dependency>

4.2 代碼實(shí)現(xiàn)

import com.volcengine.ark.runtime.model.completion.chat.ChatCompletionRequest;
import com.volcengine.ark.runtime.model.completion.chat.ChatMessage;
import com.volcengine.ark.runtime.model.completion.chat.ChatMessageRole;
import com.volcengine.ark.runtime.service.ArkService;

import java.util.ArrayList;
import java.util.List;

public class DouBaoDemo {

public static void main(String[] args) {

ArkService service = new ArkService("ARK_API_KEY");

System.out.println("\n----- 標(biāo)準(zhǔn)請求 -----");
final List<ChatMessage> messages = new ArrayList<>();
final ChatMessage systemMessage = ChatMessage.builder().role(ChatMessageRole.SYSTEM).content("你是豆包,是由字節(jié)跳動開發(fā)的 AI 人工智能助手").build();
final ChatMessage userMessage = ChatMessage.builder().role(ChatMessageRole.USER).content("請自我介紹?").build();
messages.add(systemMessage);
messages.add(userMessage);

ChatCompletionRequest chatCompletionRequest = ChatCompletionRequest.builder()
.model("${YOUR_ENDPOINT_ID}")
.messages(messages)
.build();

service.createChatCompletion(chatCompletionRequest).getChoices().forEach(choice -> System.out.println(choice.getMessage().getContent()));

System.out.println("\n----- 流請求 -----");
final List<ChatMessage> streamMessages = new ArrayList<>();
final ChatMessage streamSystemMessage = ChatMessage.builder().role(ChatMessageRole.SYSTEM).content("你是豆包,是由字節(jié)跳動開發(fā)的 AI 人工智能助手").build();
final ChatMessage streamUserMessage = ChatMessage.builder().role(ChatMessageRole.USER).content("請自我介紹?").build();
streamMessages.add(streamSystemMessage);
streamMessages.add(streamUserMessage);

ChatCompletionRequest streamChatCompletionRequest = ChatCompletionRequest.builder()
.model("${YOUR_ENDPOINT_ID}")
.messages(streamMessages)
.build();

service.streamChatCompletion(streamChatCompletionRequest)
.doOnError(Throwable::printStackTrace)
.blockingForEach(
choice -> {
if (choice.getChoices().size() > 0) {
System.out.print(choice.getChoices().get(0).getMessage().getContent());
}
}
);
service.shutdownExecutor();
}
}

上一篇:

利用Python語言調(diào)用訊飛星火認(rèn)知大模型接口實(shí)戰(zhàn)指南

下一篇:

利用Python調(diào)用百度千帆大模型接口實(shí)戰(zhàn)指南
#你可能也喜歡這些API文章!

我們有何不同?

API服務(wù)商零注冊

多API并行試用

數(shù)據(jù)驅(qū)動選型,提升決策效率

查看全部API→
??

熱門場景實(shí)測,選對API

#AI文本生成大模型API

對比大模型API的內(nèi)容創(chuàng)意新穎性、情感共鳴力、商業(yè)轉(zhuǎn)化潛力

25個渠道
一鍵對比試用API 限時免費(fèi)

#AI深度推理大模型API

對比大模型API的邏輯推理準(zhǔn)確性、分析深度、可視化建議合理性

10個渠道
一鍵對比試用API 限時免費(fèi)