
一文快速了解如何調(diào)用天工API接口
接入模型表單字段詳細(xì)說明:
參數(shù)名稱 | 參數(shù)說明 |
接入點(diǎn)名稱 | 填寫接入點(diǎn)名稱 |
接入點(diǎn)描述 | 描述接入模型的業(yè)務(wù)需求,如接入場景、用途(如測試、線上業(yè)務(wù))等 |
接入模型 | 可選擇【模型廣場】或【精調(diào)模型】中的模型進(jìn)行接入選擇【模型廣場】中的模型后,需進(jìn)一步選擇模型版本選擇【精調(diào)模型】中的模型后,需進(jìn)一步選擇模型版本和 Checkpoint。當(dāng)前僅支持基于豆包系列模型進(jìn)行精調(diào)的模型 |
購買方式 | – 支持使用【按Token付費(fèi)】、【按模型單元付費(fèi)】2種模式 |
模型單元是調(diào)用某個特定模型的 TPM(Token per Minite)配額。創(chuàng)建推理接入點(diǎn)選擇按模型單元付費(fèi)后,用戶可以獲得比按 Token 付費(fèi)更大的并發(fā)量,且無需再為 Token 消耗付費(fèi)。模型單元付費(fèi)方式為預(yù)付費(fèi)。
我們對Doubao系列模型與部分開源模型支持模型單元。支持范圍請參考產(chǎn)品計(jì)費(fèi)
目前支持在+ 創(chuàng)建推理接入 點(diǎn)配置算力保障時,進(jìn)行購買模型單元,可以配置購買模型單元的數(shù)量、時長、是否自動續(xù)費(fèi)。自動續(xù)費(fèi)支持按照單次自動續(xù)費(fèi)時長(按天)及自動續(xù)費(fèi)次數(shù)(永久生效、自定義次數(shù))自定義配置。
通過【模型推理】列表頁,找到需要調(diào)整的接入點(diǎn),點(diǎn)擊右側(cè)的 ··· 可以進(jìn)行調(diào)整模型單元、續(xù)費(fèi)、退訂。
點(diǎn)擊續(xù)費(fèi)按鈕,會跳轉(zhuǎn)到費(fèi)用中心的續(xù)費(fèi)管理頁面,可以進(jìn)行續(xù)費(fèi)操作
想要刪除買了模型單元的接入點(diǎn),需要到費(fèi)用中心退訂管理中操作模型單元退訂,退訂成功后,再進(jìn)行接入點(diǎn)的刪除操作。
注意:因?yàn)槟P蛦卧前磳?shí)例組購買的,點(diǎn)擊接入點(diǎn)名稱詳情中復(fù)制的模型單元ID是實(shí)例組 ID,實(shí)例組存在強(qiáng)綁定關(guān)系,因此續(xù)費(fèi)、退訂須同步發(fā)起。請注意,未到期的模型單元退訂會產(chǎn)生懲罰系數(shù),無法100%退費(fèi)。
進(jìn)入 API Key 管理 頁面,選擇需要的項(xiàng)目,點(diǎn)擊 創(chuàng)建 API Key,即可生成長效 API Key。all權(quán)限默認(rèn)給予項(xiàng)目下所有模型接入點(diǎn)和智能體訪問權(quán)限。
<dependency>
<groupId>com.volcengine</groupId>
<artifactId>volcengine-java-sdk-ark-runtime</artifactId>
<version>LATEST</version>
</dependency>
import com.volcengine.ark.runtime.model.completion.chat.ChatCompletionRequest;
import com.volcengine.ark.runtime.model.completion.chat.ChatMessage;
import com.volcengine.ark.runtime.model.completion.chat.ChatMessageRole;
import com.volcengine.ark.runtime.service.ArkService;
import java.util.ArrayList;
import java.util.List;
public class DouBaoDemo {
public static void main(String[] args) {
ArkService service = new ArkService("ARK_API_KEY");
System.out.println("\n----- 標(biāo)準(zhǔn)請求 -----");
final List<ChatMessage> messages = new ArrayList<>();
final ChatMessage systemMessage = ChatMessage.builder().role(ChatMessageRole.SYSTEM).content("你是豆包,是由字節(jié)跳動開發(fā)的 AI 人工智能助手").build();
final ChatMessage userMessage = ChatMessage.builder().role(ChatMessageRole.USER).content("請自我介紹?").build();
messages.add(systemMessage);
messages.add(userMessage);
ChatCompletionRequest chatCompletionRequest = ChatCompletionRequest.builder()
.model("${YOUR_ENDPOINT_ID}")
.messages(messages)
.build();
service.createChatCompletion(chatCompletionRequest).getChoices().forEach(choice -> System.out.println(choice.getMessage().getContent()));
System.out.println("\n----- 流請求 -----");
final List<ChatMessage> streamMessages = new ArrayList<>();
final ChatMessage streamSystemMessage = ChatMessage.builder().role(ChatMessageRole.SYSTEM).content("你是豆包,是由字節(jié)跳動開發(fā)的 AI 人工智能助手").build();
final ChatMessage streamUserMessage = ChatMessage.builder().role(ChatMessageRole.USER).content("請自我介紹?").build();
streamMessages.add(streamSystemMessage);
streamMessages.add(streamUserMessage);
ChatCompletionRequest streamChatCompletionRequest = ChatCompletionRequest.builder()
.model("${YOUR_ENDPOINT_ID}")
.messages(streamMessages)
.build();
service.streamChatCompletion(streamChatCompletionRequest)
.doOnError(Throwable::printStackTrace)
.blockingForEach(
choice -> {
if (choice.getChoices().size() > 0) {
System.out.print(choice.getChoices().get(0).getMessage().getContent());
}
}
);
service.shutdownExecutor();
}
}