![]() |
AI離線數字人生成服務-AIGC
專用API
【更新時間: 2024.07.15】
AI離線數字人是指存在于非物理世界中,基于計算機圖形學、圖形渲染、動作捕捉、深度學習、語音合成、人像建模等人工智能技術,創造出來的一個可供真人或計算機驅動的形象實體,具有對物理世界的感知、認知與表達能力。
咨詢
去服務商官網采購>
|
瀏覽次數
117
采購人數
4
試用次數
0
收藏
×
完成
取消
×
書簽名稱
確定
|
- API詳情
- 使用指南
- 常見 FAQ
- 關于我們
- 相關推薦


什么是AIGC的AI離線數字人生成服務?
AI離線數字人是指存在于非物理世界中,基于計算機圖形學、圖形渲染、動作捕捉、深度學習、語音合成、人像建模等人工智能技術,創造出來的一個可供真人或計算機驅動的形象實體,具有對物理世界的感知、認知與表達能力,以電子屏、VR、AR等設備為載體,實現人機交互;通過其面向媒體、金融、會議、文旅、娛樂、教育、醫療等行業,提供全新智能型服務,降低人力成本,提升服務質量和效率。在技術層面,虛擬數字人可被分為真人靈活驅動型和基于深度學習算法,智能驅動型兩類。 新華智云自主研發了真人驅動和智能驅動數字人技術,結合深度學習神經網絡和計算機圖形學,深度鉆研聲音或視覺信息到面部及身體動作的建模和渲染,讓計算機能夠理解語音和圖像的內容并以此精細驅動數字人形象的口唇、面部表情、頭部乃至全身的動作,生成極具逼真感的數字人視頻,進而實現AI驅動數字人的內容生產鏈路。同時,新華智云數字人技術全方位覆蓋了包含2D仿真人數字人、2D卡通數字人、3D卡通數字人、3D寫實數字人等各個類型的數字人創造鏈路。 作為“懂內容的技術公司”,新華智云將數字人技術與專業視頻編輯系統相結合,推出數字人大廳這款虛擬數字人的視頻編輯與生產平臺,為內容生產者提供涉及數字人相關的內容采集、編輯、存儲、分發等全生產鏈的專有技術。在國內乃至全球的數字人技術領域新華智云數字人技術都處于領先地位。
什么是AIGC的AI離線數字人生成服務接口?
AIGC的AI離線數字人生成服務有哪些核心功能?
- 照片快速生成3D數字人:通過用戶提供的照片,自動進行人臉骨骼點預測,并自動化捏制3D人臉模型,生成高度逼真的數字分身。
- 視頻采集生成2D數字人:支持用戶上傳2-5分鐘的視頻,從中提取關鍵幀,快速生成高定2D真人數字人,同時支持定制形象、聲音和動作。
- 實時渲染與智能交互:提供實時渲染技術,支持數字人在多種場景下的智能交互,包括問答、表情變化、動作執行等。
- 定制化服務:提供豐富的數字人形象庫,并支持用戶根據需求進行定制化服務,包括形象設計、聲音合成、動作捕捉等。
- API接口接入:提供API接口,方便用戶將生成的數字人集成到自己的應用或系統中,實現無縫對接。
AIGC的AI離線數字人生成服務的核心優勢是什么?
- 高效快速:通過自動化流程,大大縮短了數字人生成的時間,提高了效率。
- 高度逼真:利用先進的計算機圖形學和深度學習技術,生成的數字人形象高度逼真,接近真人效果。
- 定制化強:提供豐富的定制化選項,滿足不同用戶的個性化需求。
- 易于集成:提供便捷的API接口,方便用戶將數字人集成到自己的業務系統中。
- 應用場景廣泛:適用于媒體、金融、會議、文旅、娛樂、教育、醫療等多個領域,為用戶提供全新的智能型服務體驗。
在哪些場景會用到AIGC的AI離線數字人生成服務?
1. 媒體行業:虛擬主播制作
在媒體行業中,AIGC技術被廣泛應用于新聞播報、天氣預報、綜藝節目等節目的虛擬主播制作。虛擬數字主持人不僅承擔了日常新聞播報,還可進行多語種翻譯,在重要活動中進行了展示。河北廣電AIGC聯合實驗室打造的AI主持人融合了深度學習模式和高精度渲染技術,實現了語音與表情的高度擬真效果。這些虛擬主播不僅提高了節目的制作效率,還為觀眾帶來了新穎的觀看體驗。
2. 金融行業:虛擬客服與顧問
在金融行業,AIGC技術的應用體現在虛擬客服或虛擬顧問的角色上,它們能夠提供全天候的客戶服務或產品介紹。這些虛擬數字人通過自然語言處理等技術,可以準確理解用戶需求,并給出滿意的答復。通過AIGC實現金融資訊、產品介紹視頻內容的自動化生產,以及塑造虛擬數字人客服,這不僅提升了服務效率,還增強了用戶的互動體驗。
3. 教育行業:虛擬教師與助教
在教育行業,AIGC技術被用作虛擬教師或助教,輔助教學活動或提供學習資源。AIGC技術通過分析用戶數據,為傳媒藝術領域提供了個性化內容生成的可能,這在推薦系統和定制化服務中尤為重要。同時,AIGC技術也在教育和培訓領域展現出巨大潛力,通過虛擬教師和模擬訓練環境,為學生提供了更加互動和沉浸式的學習體驗,從而變革了傳統的教育模式。
2. 娛樂行業:虛擬偶像與角色
在娛樂行業,AIGC技術作為虛擬偶像或角色,參與游戲、動畫、電影等娛樂內容的制作。AIGC技術使得虛擬偶像的創作變得更加簡單。虛擬數字人可以通過學習大量數據來模擬偶像的言行舉止,甚至可以根據用戶需求進行個性化表演,為用戶帶來全新的視聽體驗。一些AIGC項目開始運用在虛擬偶像二創領域,粉絲用AI作畫工具為心愛的虛擬偶像創作插畫甚至是cosplay,豐富衍生的圖片內容。這些技術的進步讓虛擬偶像的二創跨出了一大步,不再局限于視覺,為娛樂產業帶來了新的可能性。


1. 概述
離線數字人API支持2D仿真和3D寫實數字人合成服務。本文檔將指導開發者如何使用該API,包括接口調用、參數說明和常見錯誤處理。
2. 域名及請求加簽
-
請求地址:
https://api.shuwen.com
-
請求方式: GET/POST
-
接口路徑示例:
/open/digitalMan/pageQuery?pageNo=1&pageSize=10
3. 數字人列表查詢接口
3.1 接口調用
-
請求方式: GET
-
請求路徑:
/open/digitalMan/pageQuery
-
請求參數:
-
pageNo
(必填): Integer, 分頁頁碼 -
pageSize
(必填): Integer, 分頁大小
-
3.2 接口結果
-
返回數據結構:
-
total
: 數據總量 -
data
: 數字人信息數組-
id
: 數字人ID -
name
: 名稱 -
description
: 描述 -
preImg
: 預覽圖
-
-
4. 數字人詳情查詢接口
4.1 接口調用
-
請求方式: GET
-
請求路徑:
/open/digitalMan/detaiQuery/
-
請求參數: 數字人ID(必填)
4.2 接口結果
-
返回數據結構包括:
-
voices
: 數字人聲音信息 -
clothes
: 數字人服飾信息
-
5. 數字人合成相關接口
5.1 合成接口調用
-
請求方式: POST
-
請求路徑:
/open/digitalMan/batch/generate
-
請求參數:
{
"generateParam": [
{
"algoParam": {
"video": {},
"background": "背景圖URL",
"tts": {
"text": "合成文本",
"per": "聲音ID"
},
"position": [0, 0, 1080, 1801],
"code": "數字人編碼",
"is_green": true,
"subtitle": true
}
}
],
"callBackUrl": "回調地址"
}
5.2 合成接口結果
-
返回任務的
groupId
5.3 合成任務查詢接口
-
請求方式: GET
-
請求路徑:
/open/digitalMan/batch/query/
-
請求參數:
groupId
5.4 合成任務結果返回
-
返回數據包括:
-
status
: 當前子任務合成狀態 -
composeUrl
: 合成視頻的URL -
textSegs
: 播報內容的相關信息
-
5.5 異步回調方式
-
客戶端需根據簽名驗證回調請求的合法性。
6. 字幕文件生成
6.1 接口調用
-
請求方式: POST
-
請求路徑:
/open/digitalMan/subtitle/generate
-
請求參數:
-
taskId
: 任務ID -
type
: 字幕類型(可選,默認srt
)
-
6.2 合成結果
-
返回字幕文件的URL
7. 常見錯誤碼
-
SW-DM-1000
: 合成任務創建失敗 -
SW-DM-1001
: 租戶ID缺失 -
SW-DM-1002
: 主參數缺失 -
SW-DM-1003
:generateParam
參數缺失 -
SW-DM-1004
:algoParam
參數缺失 -
SW-DM-1005
: 數字人形象code參數缺失 -
SW-DM-1006
:tts
參數缺失
8. 結語
指南詳情鏈接:https://aigc.shuwen.com/docs/zh-cn/human/real.html




虛擬數字人是指存在于非物理世界中,基于計算機圖形學、圖形渲染、動作捕捉、深度學習、語音合成、人像建模等人工智能技術,創造出來的一個可供真人或計算機驅動的形象實體,具有對物理世界的感知、認知與表達能力,以電子屏、VR、AR等設備為載體,實現人機交互;通過其面向媒體、金融、會議、文旅、娛樂、教育、醫療等行業,提供全新智能型服務,降低人力成本,提升服務質量和效率。在技術層面,虛擬數字人可被分為真人靈活驅動型和基于深度學習算法,智能驅動型兩類。 新華智云自主研發了真人驅動和智能驅動數字人技術,結合深度學習神經網絡和計算機圖形學,深度鉆研聲音或視覺信息到面部及身體動作的建模和渲染,讓計算機能夠理解語音和圖像的內容并以此精細驅動數字人形象的口唇、面部表情、頭部乃至全身的動作,生成極具逼真感的數字人視頻,進而實現AI驅動數字人的內容生產鏈路。同時,新華智云數字人技術全方位覆蓋了包含2D仿真人數字人、2D卡通數字人、3D卡通數字人、3D寫實數字人等各個類型的數字人創造鏈路。 作為“懂內容的技術公司”,新華智云將數字人技術與專業視頻編輯系統相結合,推出數字人大廳這款虛擬數字人的視頻編輯與生產平臺,為內容生產者提供涉及數字人相關的內容采集、編輯、存儲、分發等全生產鏈的專有技術。在國內乃至全球的數字人技術領域新華智云數字人技術都處于領先地位。早在2019年6月我方產品已經投入市場使用。目前已經有超過280家國內機構、覆蓋了22個省、使用我方數字人產品,市場成熟度高、并已應用在媒體、文旅、會展、金融等領域。


1. 概述
離線數字人API支持2D仿真和3D寫實數字人合成服務。本文檔將指導開發者如何使用該API,包括接口調用、參數說明和常見錯誤處理。
2. 域名及請求加簽
-
請求地址:
https://api.shuwen.com
-
請求方式: GET/POST
-
接口路徑示例:
/open/digitalMan/pageQuery?pageNo=1&pageSize=10
3. 數字人列表查詢接口
3.1 接口調用
-
請求方式: GET
-
請求路徑:
/open/digitalMan/pageQuery
-
請求參數:
-
pageNo
(必填): Integer, 分頁頁碼 -
pageSize
(必填): Integer, 分頁大小
-
3.2 接口結果
-
返回數據結構:
-
total
: 數據總量 -
data
: 數字人信息數組-
id
: 數字人ID -
name
: 名稱 -
description
: 描述 -
preImg
: 預覽圖
-
-
4. 數字人詳情查詢接口
4.1 接口調用
-
請求方式: GET
-
請求路徑:
/open/digitalMan/detaiQuery/
-
請求參數: 數字人ID(必填)
4.2 接口結果
-
返回數據結構包括:
-
voices
: 數字人聲音信息 -
clothes
: 數字人服飾信息
-
5. 數字人合成相關接口
5.1 合成接口調用
-
請求方式: POST
-
請求路徑:
/open/digitalMan/batch/generate
-
請求參數:
{
"generateParam": [
{
"algoParam": {
"video": {},
"background": "背景圖URL",
"tts": {
"text": "合成文本",
"per": "聲音ID"
},
"position": [0, 0, 1080, 1801],
"code": "數字人編碼",
"is_green": true,
"subtitle": true
}
}
],
"callBackUrl": "回調地址"
}
5.2 合成接口結果
-
返回任務的
groupId
5.3 合成任務查詢接口
-
請求方式: GET
-
請求路徑:
/open/digitalMan/batch/query/
-
請求參數:
groupId
5.4 合成任務結果返回
-
返回數據包括:
-
status
: 當前子任務合成狀態 -
composeUrl
: 合成視頻的URL -
textSegs
: 播報內容的相關信息
-
5.5 異步回調方式
-
客戶端需根據簽名驗證回調請求的合法性。
6. 字幕文件生成
6.1 接口調用
-
請求方式: POST
-
請求路徑:
/open/digitalMan/subtitle/generate
-
請求參數:
-
taskId
: 任務ID -
type
: 字幕類型(可選,默認srt
)
-
6.2 合成結果
-
返回字幕文件的URL
7. 常見錯誤碼
-
SW-DM-1000
: 合成任務創建失敗 -
SW-DM-1001
: 租戶ID缺失 -
SW-DM-1002
: 主參數缺失 -
SW-DM-1003
:generateParam
參數缺失 -
SW-DM-1004
:algoParam
參數缺失 -
SW-DM-1005
: 數字人形象code參數缺失 -
SW-DM-1006
:tts
參數缺失
8. 結語
指南詳情鏈接:https://aigc.shuwen.com/docs/zh-cn/human/real.html






虛擬數字人是指存在于非物理世界中,基于計算機圖形學、圖形渲染、動作捕捉、深度學習、語音合成、人像建模等人工智能技術,創造出來的一個可供真人或計算機驅動的形象實體,具有對物理世界的感知、認知與表達能力,以電子屏、VR、AR等設備為載體,實現人機交互;通過其面向媒體、金融、會議、文旅、娛樂、教育、醫療等行業,提供全新智能型服務,降低人力成本,提升服務質量和效率。在技術層面,虛擬數字人可被分為真人靈活驅動型和基于深度學習算法,智能驅動型兩類。 新華智云自主研發了真人驅動和智能驅動數字人技術,結合深度學習神經網絡和計算機圖形學,深度鉆研聲音或視覺信息到面部及身體動作的建模和渲染,讓計算機能夠理解語音和圖像的內容并以此精細驅動數字人形象的口唇、面部表情、頭部乃至全身的動作,生成極具逼真感的數字人視頻,進而實現AI驅動數字人的內容生產鏈路。同時,新華智云數字人技術全方位覆蓋了包含2D仿真人數字人、2D卡通數字人、3D卡通數字人、3D寫實數字人等各個類型的數字人創造鏈路。 作為“懂內容的技術公司”,新華智云將數字人技術與專業視頻編輯系統相結合,推出數字人大廳這款虛擬數字人的視頻編輯與生產平臺,為內容生產者提供涉及數字人相關的內容采集、編輯、存儲、分發等全生產鏈的專有技術。在國內乃至全球的數字人技術領域新華智云數字人技術都處于領先地位。早在2019年6月我方產品已經投入市場使用。目前已經有超過280家國內機構、覆蓋了22個省、使用我方數字人產品,市場成熟度高、并已應用在媒體、文旅、會展、金融等領域。