百度曦靈數字人服務-百度智能云

百度曦靈數字人服務-百度智能云

專用API
【更新時間: 2024.08.22】 百度曦靈數字人服務是一個以數字人為核心的,基于大模型和生成式AI技術,為用戶提供數字人克隆和數字人應用的SaaS平臺,曦靈數字人對話是基于百度的大模型以及生成式AI技術。
瀏覽次數
85
采購人數
0
試用次數
0
! SLA: N/A
! 響應: N/A
! 適用于個人&企業
收藏
×
完成
取消
×
書簽名稱
確定
<
產品介紹
>

什么是百度智能云的百度曦靈數字人服務?

百度曦靈數字人服務是一個以數字人為核心的,基于大模型和生成式AI技術,為用戶提供數字人克隆和數字人應用的SaaS平臺,曦靈數字人對話是基于百度的大模型以及生成式AI技術,打造的數字人智能體一站式配置和應用。旨在為客戶打造高效、自動化的直播環境,以實現極致的開播效率和卓越的帶貨體驗。

什么是百度智能云的百度曦靈數字人服務接口?

由服務使用方的應用程序發起,以Restful風格為主、通過公網HTTP協議調用百度智能云的百度曦靈數字人服務 ,從而實現程序的自動化交互,提高服務效率。

百度智能云的百度曦靈數字人服務有哪些核心功能?

數字人定制


用戶使用曦靈進行了人像克隆和聲音克隆后,對應資產會顯示在該頁面中,支持進行編輯管理。 平臺還提供了800+個公共人像和150+個公共音色供用戶在直播、視頻、對話應用中使用。

直播工作臺


為匹配直播客戶「先授權-再開播」的使用習慣,支持用戶授權美團、快手、抖音、淘寶、京東等多個平臺,并支持用戶直接在平臺中查看自己的直播間數據。

視頻工作臺


視頻工作臺包含四種制作視頻的方式:裂變視頻、精編視頻、分身視頻、AI卡片,分別適用于不同的制作視頻的場景

對話工作臺


對話工作臺基于百度文心大模型以及生成式AI技術打造,可以一站式配置和應用數字人智能體,為終端用戶提供7x24小時的專業服務。

百度智能云的百度曦靈數字人服務的核心優勢是什么?

  1. 數字人形象制作方式多樣:曦靈數字人支持文生3D數字人,一句話即可創造 3D 形象,所見即所得;曦靈2D 數字人克隆采用最新 AI 算法,人像效果超擬真;上傳照片即可進行照片數字人克隆,可用于制作AI 名片、活動電子邀請函等類型的AI卡片

  2. 多樣化數字人形象:豐富的公共數字人形象,包括2D和3D多種形象可供選擇,搭配數字人克隆,可打造個性化的數字人直播間、數字人視頻創作和數字人對話場景。智能化的視頻編輯工具,如AI幫寫、AI動作等等,可快速制作不同形式的高質量視頻內容

  3. 大模型加持助力用戶降本提效:通過智能直播間裝修、智能話術文案生成、智能彈幕互動,曦靈數字人大幅降低直播間搭建門檻和運營成本,同時提升經營效率;智能化的視頻編輯工具,如AI幫寫、AI動作等等,可快速制作不同形式的高質量視頻內容,工具簡單易用化,無需專業的視頻編輯技能,讓用戶更加專注于創意和內容的呈現;基于大模型,三步即可快速配置有知識、有技能、有人格的數字人智能體,通過上傳文檔構建數字人的專屬知識庫,讓數字人具有通識、行業知識、企業知識的多層知識體系。

     

  4. 多種音色風格:支持將文本轉換成富有感染力和真實性的語音,使信息傳達更加生動有力。音色克隆讓聲音更個性更自然更有辨識度。無論是直播帶貨還是客戶服務,有真實感的 TTS 為您的產品增添無盡說服力。

     

  5. 多渲染模式:支持云渲染兼容 WebRTC /RTMP /...等多種通信協議,也支持端渲染,使用自研端渲染引擎適配 H5/Android/iOS 等多終端場景。

     

  6. 海量精美模板:提供豐富的多類型直播間裝修、視頻制作和數字人對話模板,通過模板快速編輯制作,一鍵模板開箱即用,為用戶提供快速優質的數字人內容制作體驗。

在哪些場景會用到百度智能云的百度曦靈數字人服務?

  1. 電商直播:電商企業可以利用曦靈數字人直播解決方案,創建虛擬主播進行24小時不間斷直播,提升帶貨效率。通過AI技術,這些數字人能夠與用戶進行互動,回答產品相關問題,并促進銷售。
  2. 教育培訓:教育機構可以使用曦靈數字人視頻制作功能,創建虛擬講師進行課程解說和教學。這種方式不僅可以節省真人講師的時間成本,還能通過多樣化的數字人形象和視頻形式,提高學生的學習興趣和參與度。
  3. 客戶服務:企業可以將曦靈數字人對話應用于公眾號、小程序、網站等終端場景,提供7x24小時的客戶服務。數字人能夠回答用戶咨詢,解決常見問題,提升用戶滿意度和企業的運營效率。
  4. 品牌營銷:品牌可以利用曦靈數字人創建具有品牌特色的虛擬代言人,進行品牌宣傳和推廣。這些數字人可以在社交媒體、廣告視頻等多種渠道中展示,增強品牌的記憶點和吸引力。
<
產品價格
>

<
使用指南
>

一、登錄曦靈數字人SaaS平臺

  1. 支持在未登錄狀態下瀏覽部分頁面,但瀏覽更多頁面及進行一些頁面操作需進行賬號登錄。
  2. 用戶可使用百度賬號/百度智能云賬號登錄。

二、首頁功能介紹

  1. 克隆入口模塊:點擊頁面中“2D數字人克隆”可進入2D數字人克隆頁;點擊“照片數字人克隆”可進入照片數字人克隆頁;點擊“音色克隆”可進入音色克隆頁。
  2. 我的形象&我的音色模塊:展示我克隆的2D極速克隆、2D精品克隆和照片克隆的人像;未定制時展示三種示例人像,點擊示例人像跳轉對應的人像克隆頁面。
  3. 我的應用模塊:展示數字人直播、數字人視頻、數字人對話三個核心功能的相關數據。點擊“極速開播”按鈕進入直播工作臺頁面;點擊“開始創作”按鈕進入視頻工作臺頁面;點擊“快速搭建”按鈕進入對話工作臺頁面。

三、數字人管理頁

  1. 當用戶使用曦靈進行了人像克隆和聲音克隆后,對應資產會顯示在該頁面中,支持用戶進行編輯管理。
  2. 平臺提供800+個公共人像和150+個公共音色供用戶在直播、視頻、對話應用中使用。

四、2D數字人克隆

  1. 精品克隆:適用于需要高度還原真人的應用場景,如真人IP短視頻生產。訓練視頻需張口錄制,并保留音頻,4小時可完成訓練。
  2. 極速克隆:適用于追求人像克隆效率的應用場景,如品牌直播。訓練視頻需閉口錄制,無需保留音頻,30分鐘即可完成訓練。

五、照片數字人克隆

  1. 適用于需要大批量生成數字人,但缺乏底板視頻拍攝條件的場景。
  2. 通過照片克隆人像進行簡單內容播報,如AI名片、保險經紀人應用場景。

六、3D數字人生成

  1. 用戶輸入一句想要的人像風格的文案,即可自動生成3D數字人。
  2. 適用于打造企業IP、文旅IP、娛樂IP等應用場景。

七、音色克隆

  1. 僅需10s錄音,1分鐘之內就能生成自己的定制音色。
  2. 用于數字人的播報和內容生產。

八、直播工作臺

  1. 支持用戶授權多個平臺,并直接在平臺中查看直播間數據。
  2. 支持選品并一鍵創建直播間,未授權賬號也可使用體驗模式。
  3. 直播間編輯界面支持商品的添加、復制、刪除等操作,并可調整文案、模板等。
  4. 直播過程中支持真人接管功能。

九、視頻工作臺

  1. 包含裂變視頻、精編視頻、分身視頻、AI卡片四種制作視頻的方式。
  2. 分別適用于不同的視頻制作場景,如廣告投放、招聘、加盟等。

十、對話工作臺

  1. 基于百度文心大模型及生成式AI技術打造,可一站式配置和應用數字人智能體。
  2. 支持構建有知識、有技能、有人格的新一代交互型數字人。
  3. 可將數字人應用在公眾號、小程序、網站等多種終端場景,提供7x24小時的專業服務。

詳情查看鏈接:https://cloud.baidu.com/doc/AI_DH_CLOUD/s/Ylx39dvr8

<
產品問答
>
?
2D數字人克隆視頻無法上傳
請檢查:視頻尺寸是否為標準的9:16、視頻格式是否為mp4、分辨率是否為1080p;如不符合格式邀請,請使用視頻處理工具將視頻進行調整,將調整后的視頻重新上傳
?
2D數字人克隆視頻上傳后人像訓練失敗
請檢查視頻素材是否存在臉部被遮擋或大幅度轉頭情況、檢查視頻素材前后是否存在黑色畫面;存在臉部被遮擋或大幅度轉頭情況,請重新拍攝,注意不要遮擋臉部,轉角不要超過45度;視頻素材前后是否存在黑色畫面的,可以將黑色部分剪輯掉,再進行訓練
?
點擊開啟直播后,無動態數字人畫面
檢查google瀏覽器地址欄右側是否有攔截彈窗圖標,若有圖標則點擊圖標,選擇始終允許,刷新后重新開始直播
?
數字人畫面卡頓
1、打開任務管理器,點擊性能選項,看cpu或內存是否占用率達到90%以上,解決方法:關閉非必要軟件,如仍無法解決,需要提升電腦配置,端版本本推薦顯卡為3060,內存32g以上;2、檢查google瀏覽器是否開啟硬件加速,可點擊瀏覽器設置-系統-開啟硬件加速;3、若抖音開播,檢查wecam中捕捉的畫面幀數是否為25及以上,在wecam中調整捕捉窗口的幀數,至少達到25
?
數字人清晰度低
1、檢查顯示屏分辨率是否為1080p及以上,如不是,需要調整分辨率為1920×1080或以上;2、數字人在捕捉過程中會有一定的清晰度損失,若差別較小則屬于正?,F象
?
數字人開播后,平臺內“彈”字按鈕無法點擊,提示未授權
1、檢查賬號是否已經完成彈幕授權,如未授權彈幕,先進行彈幕授權;2、檢查數字人平臺右上角授權平臺與開播平臺是否一致,請調整右上角授權賬號與平臺一致;3、美團直播需檢查直播間id是否正確,美團每場直播id會有變動,需要重新正確填寫
?
是否支持克隆音色
可在數字人頁面點擊音色克隆,通過上傳符合要求的音頻即可克隆音色
?
是否可以自行配音
支持您上傳音頻或者使用平臺錄音驅動數字人適應唇形的。
?
我想定制自己的分身,但沒有找到訓練入口
當前分身訓練,我們會對您的視頻拍攝進行1v1指導和審核,如有分身訓練需求,請咨詢官方助手。
?
是否提供 API 接口
這個需要根據您的詳細需求以及使用場景進一步分析,如有問題,可在官網添加百度曦靈數字人官方助手做進一步了解。
<
關于我們
>
北京百度網訊科技有限公司是一家領先的人工智能平臺型公司,提供全面的云服務和解決方案。公司依托強大的云計算能力,結合百度大腦和大數據技術,為企業和開發者提供包括云服務器、對象存儲、內容分發網絡、人工智能、企業服務等在內的多樣化產品和服務。通過智能化解決方案,百度智能云助力各行業實現數字化轉型和智能化升級,推動產業創新和社會進步。
聯系信息
服務時間: 7 * 24
電話號碼: +86 10 5992 8888
網頁在線客服: 咨詢

 

安全合規可信的云服務

<
最可能同場景使用的其他API
>
API接口列表
<
產品價格
>

<
使用指南
>

一、登錄曦靈數字人SaaS平臺

  1. 支持在未登錄狀態下瀏覽部分頁面,但瀏覽更多頁面及進行一些頁面操作需進行賬號登錄。
  2. 用戶可使用百度賬號/百度智能云賬號登錄。

二、首頁功能介紹

  1. 克隆入口模塊:點擊頁面中“2D數字人克隆”可進入2D數字人克隆頁;點擊“照片數字人克隆”可進入照片數字人克隆頁;點擊“音色克隆”可進入音色克隆頁。
  2. 我的形象&我的音色模塊:展示我克隆的2D極速克隆、2D精品克隆和照片克隆的人像;未定制時展示三種示例人像,點擊示例人像跳轉對應的人像克隆頁面。
  3. 我的應用模塊:展示數字人直播、數字人視頻、數字人對話三個核心功能的相關數據。點擊“極速開播”按鈕進入直播工作臺頁面;點擊“開始創作”按鈕進入視頻工作臺頁面;點擊“快速搭建”按鈕進入對話工作臺頁面。

三、數字人管理頁

  1. 當用戶使用曦靈進行了人像克隆和聲音克隆后,對應資產會顯示在該頁面中,支持用戶進行編輯管理。
  2. 平臺提供800+個公共人像和150+個公共音色供用戶在直播、視頻、對話應用中使用。

四、2D數字人克隆

  1. 精品克隆:適用于需要高度還原真人的應用場景,如真人IP短視頻生產。訓練視頻需張口錄制,并保留音頻,4小時可完成訓練。
  2. 極速克隆:適用于追求人像克隆效率的應用場景,如品牌直播。訓練視頻需閉口錄制,無需保留音頻,30分鐘即可完成訓練。

五、照片數字人克隆

  1. 適用于需要大批量生成數字人,但缺乏底板視頻拍攝條件的場景。
  2. 通過照片克隆人像進行簡單內容播報,如AI名片、保險經紀人應用場景。

六、3D數字人生成

  1. 用戶輸入一句想要的人像風格的文案,即可自動生成3D數字人。
  2. 適用于打造企業IP、文旅IP、娛樂IP等應用場景。

七、音色克隆

  1. 僅需10s錄音,1分鐘之內就能生成自己的定制音色。
  2. 用于數字人的播報和內容生產。

八、直播工作臺

  1. 支持用戶授權多個平臺,并直接在平臺中查看直播間數據。
  2. 支持選品并一鍵創建直播間,未授權賬號也可使用體驗模式。
  3. 直播間編輯界面支持商品的添加、復制、刪除等操作,并可調整文案、模板等。
  4. 直播過程中支持真人接管功能。

九、視頻工作臺

  1. 包含裂變視頻、精編視頻、分身視頻、AI卡片四種制作視頻的方式。
  2. 分別適用于不同的視頻制作場景,如廣告投放、招聘、加盟等。

十、對話工作臺

  1. 基于百度文心大模型及生成式AI技術打造,可一站式配置和應用數字人智能體。
  2. 支持構建有知識、有技能、有人格的新一代交互型數字人。
  3. 可將數字人應用在公眾號、小程序、網站等多種終端場景,提供7x24小時的專業服務。

詳情查看鏈接:https://cloud.baidu.com/doc/AI_DH_CLOUD/s/Ylx39dvr8

<
依賴服務
>
<
產品問答
>
?
2D數字人克隆視頻無法上傳
請檢查:視頻尺寸是否為標準的9:16、視頻格式是否為mp4、分辨率是否為1080p;如不符合格式邀請,請使用視頻處理工具將視頻進行調整,將調整后的視頻重新上傳
?
2D數字人克隆視頻上傳后人像訓練失敗
請檢查視頻素材是否存在臉部被遮擋或大幅度轉頭情況、檢查視頻素材前后是否存在黑色畫面;存在臉部被遮擋或大幅度轉頭情況,請重新拍攝,注意不要遮擋臉部,轉角不要超過45度;視頻素材前后是否存在黑色畫面的,可以將黑色部分剪輯掉,再進行訓練
?
點擊開啟直播后,無動態數字人畫面
檢查google瀏覽器地址欄右側是否有攔截彈窗圖標,若有圖標則點擊圖標,選擇始終允許,刷新后重新開始直播
?
數字人畫面卡頓
1、打開任務管理器,點擊性能選項,看cpu或內存是否占用率達到90%以上,解決方法:關閉非必要軟件,如仍無法解決,需要提升電腦配置,端版本本推薦顯卡為3060,內存32g以上;2、檢查google瀏覽器是否開啟硬件加速,可點擊瀏覽器設置-系統-開啟硬件加速;3、若抖音開播,檢查wecam中捕捉的畫面幀數是否為25及以上,在wecam中調整捕捉窗口的幀數,至少達到25
?
數字人清晰度低
1、檢查顯示屏分辨率是否為1080p及以上,如不是,需要調整分辨率為1920×1080或以上;2、數字人在捕捉過程中會有一定的清晰度損失,若差別較小則屬于正?,F象
?
數字人開播后,平臺內“彈”字按鈕無法點擊,提示未授權
1、檢查賬號是否已經完成彈幕授權,如未授權彈幕,先進行彈幕授權;2、檢查數字人平臺右上角授權平臺與開播平臺是否一致,請調整右上角授權賬號與平臺一致;3、美團直播需檢查直播間id是否正確,美團每場直播id會有變動,需要重新正確填寫
?
是否支持克隆音色
可在數字人頁面點擊音色克隆,通過上傳符合要求的音頻即可克隆音色
?
是否可以自行配音
支持您上傳音頻或者使用平臺錄音驅動數字人適應唇形的。
?
我想定制自己的分身,但沒有找到訓練入口
當前分身訓練,我們會對您的視頻拍攝進行1v1指導和審核,如有分身訓練需求,請咨詢官方助手。
?
是否提供 API 接口
這個需要根據您的詳細需求以及使用場景進一步分析,如有問題,可在官網添加百度曦靈數字人官方助手做進一步了解。
<
關于我們
>
北京百度網訊科技有限公司是一家領先的人工智能平臺型公司,提供全面的云服務和解決方案。公司依托強大的云計算能力,結合百度大腦和大數據技術,為企業和開發者提供包括云服務器、對象存儲、內容分發網絡、人工智能、企業服務等在內的多樣化產品和服務。通過智能化解決方案,百度智能云助力各行業實現數字化轉型和智能化升級,推動產業創新和社會進步。
聯系信息
服務時間: 7 * 24
電話號碼: +86 10 5992 8888
網頁在線客服: 咨詢

 

安全合規可信的云服務

<
合作案例
>

壽光蔬菜

 

泰康人壽

 

國家電網 國網新疆電力公司

 

常熟經濟技術開發區

 

火星人集成灶

 

寶鋼集團

 

BAOWU

 

源創電噴

 

恒逸

 

中國建材集團有限公司

 

國家電網湖南電力公司

 

 

重慶兩江新區 三一重工 徐州工業
<
最可能同場景使用的其他API
>