AI數(shù)字人視頻生成服務(wù)-D human

AI數(shù)字人視頻生成服務(wù)-D human

專用API
【更新時(shí)間: 2024.07.17】 D-Human是廣州深聲科技(Deepsound)推出的先進(jìn)數(shù)字人技術(shù),由小米科技投資,中科院博士團(tuán)隊(duì)研發(fā)。提供1:1真人還原效果,支持SaaS、API和OEM等多種合作模式,確保5天內(nèi)快速交付。
瀏覽次數(shù)
145
采購人數(shù)
5
試用次數(shù)
0
! SLA: N/A
! 響應(yīng): N/A
! 適用于個(gè)人&企業(yè)
收藏
×
完成
取消
×
書簽名稱
確定
<
產(chǎn)品介紹
>

什么是D human的AI數(shù)字人視頻生成服務(wù)?

“AI數(shù)字人視頻生成服務(wù)” 是利用人工智能技術(shù)生成虛擬數(shù)字人的視頻服務(wù)。這種技術(shù)結(jié)合了圖像處理、語音合成和自然語言處理等多項(xiàng)技術(shù),能夠快速生成高質(zhì)量的數(shù)字人視頻,廣泛應(yīng)用于虛擬主持人、虛擬客服、在線教育等領(lǐng)域。

什么是D human的AI數(shù)字人視頻生成服務(wù)接口?

由服務(wù)使用方的應(yīng)用程序發(fā)起,以Restful風(fēng)格為主、通過公網(wǎng)HTTP協(xié)議調(diào)用D human的AI數(shù)字人視頻生成服務(wù),從而實(shí)現(xiàn)程序的自動(dòng)化交互,提高服務(wù)效率。

D human的AI數(shù)字人視頻生成服務(wù)有哪些核心功能?

數(shù)字人1:1真人還原,效果業(yè)界領(lǐng)先
 
中科院博士帶隊(duì)攻關(guān),掌握數(shù)字人全棧技術(shù)
  • 門檻低:8分鐘視頻即可克隆自己/他人
  • 效果好:形象逼真,動(dòng)作自然,還原度評分95+。
  • 成本低:千元級數(shù)字人定制,絕對的價(jià)格優(yōu)勢。
  • 交付快:支持SaaS使用、API接入、OEM定制,5天內(nèi)交付。
克隆目標(biāo)人聲音,讓數(shù)字人效果無限接近真人
 
多次斬獲國內(nèi)外大獎(jiǎng),累計(jì)用戶20,000,000+
覆蓋全行業(yè)的原創(chuàng)視頻模板,助你三步出片
 
選模板 > 改文案 > 點(diǎn)“生成”,爆款信手拈來
  • 畫面:無需調(diào)整布局,資深設(shè)計(jì)師為你操刀解決。
  • 文案:無需苦思文案臺(tái)詞,資深營銷師替你精雕細(xì)琢。
  • 商用:全平臺(tái)正版素材,商用無憂。

D human的AI數(shù)字人視頻生成服務(wù)的核心優(yōu)勢是什么?

  1. 95+:數(shù)字人還原度評分95+,業(yè)界領(lǐng)先
  2. 20,000,000+:形象克隆+聲音克隆累計(jì)用戶超過兩千萬
  3. SaaS/API/OEM:為科技企業(yè)、MCN、自媒體提供多種合作方式
  4. 豐富的合作方式:數(shù)字人平臺(tái)D-Human、數(shù)字人平臺(tái)OEM定制、API接入、渠道入駐

在哪些場景會(huì)用到D human的AI數(shù)字人視頻生成服務(wù)?

知識口播

知識口播是一種通過口頭傳播知識的方式,通常涉及教育、科普等領(lǐng)域。它可以通過電臺(tái)、播客、視頻平臺(tái)等渠道進(jìn)行傳播,內(nèi)容涵蓋歷史、科學(xué)、文化等多個(gè)方面。

金融保險(xiǎn)

金融保險(xiǎn)是指通過保險(xiǎn)合同,將個(gè)人或企業(yè)面臨的風(fēng)險(xiǎn)轉(zhuǎn)移給保險(xiǎn)公司的一種金融活動(dòng)。它包括人壽保險(xiǎn)、財(cái)產(chǎn)保險(xiǎn)、健康保險(xiǎn)等多種類型,旨在為投保人提供經(jīng)濟(jì)保障和風(fēng)險(xiǎn)管理。

企業(yè)宣傳

企業(yè)宣傳是指企業(yè)通過各種媒介和活動(dòng),向公眾傳遞其品牌、產(chǎn)品、服務(wù)等信息的過程。這包括廣告、公關(guān)活動(dòng)、社交媒體營銷等,目的是提升企業(yè)形象和知名度,吸引潛在客戶。

直播帶貨

直播帶貨是一種新興的電商模式,通過直播平臺(tái)展示商品并實(shí)時(shí)互動(dòng),促進(jìn)商品銷售。主播通過展示商品、試用體驗(yàn)、解答問題等方式,吸引觀眾購買,增加銷售額。

新聞播報(bào)

新聞播報(bào)是媒體通過電視、廣播、網(wǎng)絡(luò)等渠道,向公眾傳遞新聞信息的一種方式。它包括新聞事件的報(bào)道、評論、分析等,旨在提供及時(shí)、準(zhǔn)確的新聞資訊,滿足公眾的知情權(quán)。

 

<
產(chǎn)品價(jià)格
>

<
使用指南
>

聲科技數(shù)字人接口文檔

I. 接口調(diào)用基礎(chǔ)

  1. 接口使用HTTP 1.1 協(xié)議,遵循RESTful規(guī)范;
  2. 接口調(diào)用的基礎(chǔ)地址:https://api.deepsound.cn/
  3. 鑒權(quán)流程, 請參考深聲官網(wǎng)簽名方式: 簽名方式

 

II. 數(shù)字人管理接口

數(shù)字人管理接口交互流程如下:
圖片

2.1 數(shù)字人生成

請求路徑

接口標(biāo)識 請求路徑 請求方式 說明
avatar.v1.2D.createModel /avatar/v1/2d/model/create POST 用于創(chuàng)建數(shù)字人。需要提前將視頻素材轉(zhuǎn)換為互聯(lián)網(wǎng)可訪問的URL。

 

請求體

字段名 類型 是否必選 說明
video_url URL 數(shù)字人視頻鏈接,不超過256字符。視頻需要符合視頻錄制標(biāo)準(zhǔn)
callback_url URL 數(shù)字人構(gòu)建結(jié)果回調(diào)URL;回調(diào)調(diào)用規(guī)格請參考avatar.v1.2D.callback.createModel
name String 數(shù)字人名稱,不超過64字符。
client_info String 用戶自定義的文本信息,用于標(biāo)識、備注等用途;不超過256字符。

 

返回值

字段名 類型 是否返回 說明
code Integer 響應(yīng)成功時(shí)取值為整數(shù)0, 其它取值詳見狀態(tài)碼說明。
message String 關(guān)于響應(yīng)結(jié)果的說明。
data Object 后續(xù)表格中,"data.x"表示data對象的屬性x。如果code不為0,data字段為空,data中的其他數(shù)據(jù)將無法獲取。
data.model_id String 數(shù)字人創(chuàng)建之后的唯一id,用于后續(xù)的生成進(jìn)度查詢、視頻生成。

 

錯(cuò)誤碼

錯(cuò)誤碼 錯(cuò)誤碼說明
2005 不支持的視頻類型
2006 視頻大小不符合要求

 

調(diào)用示例

curl 命令行

curl -X POST -H 'Accept: */*' -H 'Accept-Encoding: gzip, deflate, br' -H 'Connection: keep-alive' -H 'Content-Length: 177' -H 'Content-Type: application/json' -H 'X-Deepsound-Appid: testAppId' -H 'X-Deepsound-Sign: MD5 1218F24F52A36307C989C92F987056C5' -H 'X-Deepsound-Timestamp: 1664348729' -d '{"video_url": "https://tideo.oss-cn-shanghai.aliyuncs.com/upload/video/xxxx.mp4", "client_info": "{\"client_id\": 123456}", "callback_url": null, "name": "MyAvatar1"}' https://api.deepsound.cn/avatar/v1/2d/model/create

返回值

{
   "code": 0,
   "data": {
	  "model_id": "43667"
   },
   "message": "操作成功"
}

 

詳情參考:https://www.d-human.cn/dev#dhuman

 

<
關(guān)于我們
>
廣州深聲科技有限公司(Deepsound)是一家專注于數(shù)字人與智能語音技術(shù)研發(fā)和應(yīng)用的高新技術(shù)企業(yè)。公司提供數(shù)字人克隆、聲音克隆、語音識別、語音合成等服務(wù),擁有數(shù)字人互動(dòng)內(nèi)容服務(wù)全棧核心技術(shù)。深聲科技致力于將數(shù)字人技術(shù)帶入人們生活的各個(gè)方面,為不同行業(yè)客戶提供創(chuàng)新與科技力量,共同創(chuàng)造更美好的世界。
聯(lián)系信息
服務(wù)時(shí)間: 00:00:00至24:00:00
電話號碼: 19076003628
郵箱: support@deepsound.cn
郵箱: mandy@deepsound.cn

廣州深聲科技有限公司(Deepsound)是一家專注于數(shù)字人與智能語音的技術(shù)研發(fā)和應(yīng)用服務(wù)商,2018年獲得小米數(shù)千萬戰(zhàn)略投資。深聲核心團(tuán)隊(duì)來自中科院、騰訊、YY,擁有數(shù)字人互動(dòng)內(nèi)容服務(wù)全棧核心技術(shù),獲得各個(gè)行業(yè)客戶及社會(huì)的認(rèn)可,先后獲頒:

 

國家高新技術(shù)企業(yè)

 

北京信息產(chǎn)業(yè)協(xié)會(huì)元宇宙專委會(huì)發(fā)起單位

 

廣州市人工智能產(chǎn)業(yè)促進(jìn)會(huì)常務(wù)理事單位

 

國際語音合成大賽BlizzardChallenge 2019第二名

 

2023年度廣州市重點(diǎn)研發(fā)計(jì)劃人工智能重大科技專項(xiàng)第一名

 

第十一屆中國創(chuàng)新創(chuàng)業(yè)大賽(廣州賽區(qū))第四名

 

深聲科技致力于將數(shù)字人技術(shù)帶入人們生活的方方面面,賦予企業(yè)和用戶創(chuàng)新與科技力量,共同創(chuàng)造更美好的世界。

<
最可能同場景使用的其他API
>
API接口列表
<
產(chǎn)品價(jià)格
>

<
使用指南
>

聲科技數(shù)字人接口文檔

I. 接口調(diào)用基礎(chǔ)

  1. 接口使用HTTP 1.1 協(xié)議,遵循RESTful規(guī)范;
  2. 接口調(diào)用的基礎(chǔ)地址:https://api.deepsound.cn/
  3. 鑒權(quán)流程, 請參考深聲官網(wǎng)簽名方式: 簽名方式

 

II. 數(shù)字人管理接口

數(shù)字人管理接口交互流程如下:
圖片

2.1 數(shù)字人生成

請求路徑

接口標(biāo)識 請求路徑 請求方式 說明
avatar.v1.2D.createModel /avatar/v1/2d/model/create POST 用于創(chuàng)建數(shù)字人。需要提前將視頻素材轉(zhuǎn)換為互聯(lián)網(wǎng)可訪問的URL。

 

請求體

字段名 類型 是否必選 說明
video_url URL 數(shù)字人視頻鏈接,不超過256字符。視頻需要符合視頻錄制標(biāo)準(zhǔn)
callback_url URL 數(shù)字人構(gòu)建結(jié)果回調(diào)URL;回調(diào)調(diào)用規(guī)格請參考avatar.v1.2D.callback.createModel
name String 數(shù)字人名稱,不超過64字符。
client_info String 用戶自定義的文本信息,用于標(biāo)識、備注等用途;不超過256字符。

 

返回值

字段名 類型 是否返回 說明
code Integer 響應(yīng)成功時(shí)取值為整數(shù)0, 其它取值詳見狀態(tài)碼說明。
message String 關(guān)于響應(yīng)結(jié)果的說明。
data Object 后續(xù)表格中,"data.x"表示data對象的屬性x。如果code不為0,data字段為空,data中的其他數(shù)據(jù)將無法獲取。
data.model_id String 數(shù)字人創(chuàng)建之后的唯一id,用于后續(xù)的生成進(jìn)度查詢、視頻生成。

 

錯(cuò)誤碼

錯(cuò)誤碼 錯(cuò)誤碼說明
2005 不支持的視頻類型
2006 視頻大小不符合要求

 

調(diào)用示例

curl 命令行

curl -X POST -H 'Accept: */*' -H 'Accept-Encoding: gzip, deflate, br' -H 'Connection: keep-alive' -H 'Content-Length: 177' -H 'Content-Type: application/json' -H 'X-Deepsound-Appid: testAppId' -H 'X-Deepsound-Sign: MD5 1218F24F52A36307C989C92F987056C5' -H 'X-Deepsound-Timestamp: 1664348729' -d '{"video_url": "https://tideo.oss-cn-shanghai.aliyuncs.com/upload/video/xxxx.mp4", "client_info": "{\"client_id\": 123456}", "callback_url": null, "name": "MyAvatar1"}' https://api.deepsound.cn/avatar/v1/2d/model/create

返回值

{
   "code": 0,
   "data": {
	  "model_id": "43667"
   },
   "message": "操作成功"
}

 

詳情參考:https://www.d-human.cn/dev#dhuman

 

<
依賴服務(wù)
>
<
關(guān)于我們
>
廣州深聲科技有限公司(Deepsound)是一家專注于數(shù)字人與智能語音技術(shù)研發(fā)和應(yīng)用的高新技術(shù)企業(yè)。公司提供數(shù)字人克隆、聲音克隆、語音識別、語音合成等服務(wù),擁有數(shù)字人互動(dòng)內(nèi)容服務(wù)全棧核心技術(shù)。深聲科技致力于將數(shù)字人技術(shù)帶入人們生活的各個(gè)方面,為不同行業(yè)客戶提供創(chuàng)新與科技力量,共同創(chuàng)造更美好的世界。
聯(lián)系信息
服務(wù)時(shí)間: 00:00:00至24:00:00
電話號碼: 19076003628
郵箱: support@deepsound.cn
郵箱: mandy@deepsound.cn

廣州深聲科技有限公司(Deepsound)是一家專注于數(shù)字人與智能語音的技術(shù)研發(fā)和應(yīng)用服務(wù)商,2018年獲得小米數(shù)千萬戰(zhàn)略投資。深聲核心團(tuán)隊(duì)來自中科院、騰訊、YY,擁有數(shù)字人互動(dòng)內(nèi)容服務(wù)全棧核心技術(shù),獲得各個(gè)行業(yè)客戶及社會(huì)的認(rèn)可,先后獲頒:

 

國家高新技術(shù)企業(yè)

 

北京信息產(chǎn)業(yè)協(xié)會(huì)元宇宙專委會(huì)發(fā)起單位

 

廣州市人工智能產(chǎn)業(yè)促進(jìn)會(huì)常務(wù)理事單位

 

國際語音合成大賽BlizzardChallenge 2019第二名

 

2023年度廣州市重點(diǎn)研發(fā)計(jì)劃人工智能重大科技專項(xiàng)第一名

 

第十一屆中國創(chuàng)新創(chuàng)業(yè)大賽(廣州賽區(qū))第四名

 

深聲科技致力于將數(shù)字人技術(shù)帶入人們生活的方方面面,賦予企業(yè)和用戶創(chuàng)新與科技力量,共同創(chuàng)造更美好的世界。

<
最可能同場景使用的其他API
>