騰訊云智能識別-人臉識別
專用API
【更新時間: 2024.04.15】
騰訊云智能識別(Intelligent Identification,II)基于騰訊各實驗室最新研究成果,為您提供視頻內容的全方位識別,支持識別視頻內的人物、語音、文字以及幀標簽,對視頻進行多維度結構化分析。
咨詢
去服務商官網采購>
|
瀏覽次數
31
采購人數
0
試用次數
0
試用
收藏
×
完成
取消
×
書簽名稱
確定
|
- API詳情
- 使用指南
- 常見 FAQ
- 關于我們

產品介紹

什么是人臉識別的騰訊云智能識別?
騰訊云智能識別(Intelligent Identification,II)基于騰訊各實驗室最新研究成果,為您提供視頻內容的全方位識別,支持識別視頻內的人物、語音、文字以及幀標簽,對視頻進行多維度結構化分析。
什么是人臉識別的騰訊云智能識別接口?
由服務使用方的應用程序發起,以Restful風格為主、通過公網HTTP協議調用人臉識別的騰訊云智能識別,從而實現程序的自動化交互,提高服務效率。
人臉識別的騰訊云智能識別有哪些核心功能?
- 人臉識別:識別視頻中的人臉信息并定位視頻中的人物所在幀以及人臉所在區域,支持自定義人物信息。
- 語音識別:快速識別視頻中的聲音并轉化成文字,適用于字幕生成及生成檢索文本等場景。
- 文字識別:識別視頻中出現的文字信息,可用于視頻內自定義關鍵詞的提取,支持豎版文字的識別。
- 語音翻譯:支持將視頻中的語音識別并翻譯成目標語言文本,支持中文、英語、日韓語等多種語言識別翻譯。
- 幀標簽識別:支持識別標簽及位置,涵蓋人物、風景、建筑、動植物、食物等9個大類,支持自定義標簽。
- 片頭片尾識別:根據視頻畫面特征、文字、語音等信息自動識別定位電影/電視劇片頭片尾時間點。
人臉識別的騰訊云智能識別的核心優勢是什么?
引擎整合
海量標簽
簡單易用
倍速可控
高可定制
準確高效
在哪些場景會用到人臉識別的騰訊云智能識別?
- 視頻生產:通過智能識別,您可輕松高效地從海量視頻中找出所關注的目標人物在視頻中出現的時間點,以及人臉所在畫面區域和持續時間,便于快速查找相關創作素材,提升后期創作效率。
- 廣電編目:通過內容識別分析等相關能力,快速理解內容結構化信息,輔助人工編目,提升運營效率。
- 智能字幕:通過智能識別,您可根據點播視頻中音頻自動生成字幕文件,同時也支持自動給直播流加上實時字幕,以及進行會場實時轉譯,便于會后進行會議紀要整理。
- 視頻廣告:通過智能識別,您可自動識別出視頻中用戶關注的物體、品牌 LOGO 和場景等出現的時間點以及所在區域。借助這些綜合信息可幫助您進行廣告精準投放,提升廣告轉化率和收益率。

使用指南


產品問答

?
智能識別支持哪些視頻格式?支持音頻嗎?直播流呢?
音頻支持 wav、mp3、aac、flac。 視頻支持 mp4、flv、mkv、avi、rmvb、ts、fmp4 等常見音視頻容器格式。 直播流支持 flv、rtmp、hls、dash等音視頻傳輸協議。 若有其他不常見格式且視頻量較大可以聯系您的騰訊云商務提出申請。
?
何挑選入庫人臉圖片能達到較好的視頻識別結果?
入庫圖片請盡量選擇正面人臉較清晰的單人像照片,圖片格式選擇jpg或png ,像素不低于200X200px。同時,您新增的人臉圖片若越接近需要處理的視頻中目標人物,識別的效果就越好。 若您需要識別目標人物在不同時期且時間間隔跨度較大的視頻,建議新增入庫的目標人物人臉圖片盡量涵蓋該人物不同時期的人像圖片,以便獲得更高的識別準確度。
?
默認處理速度如何?如何申請調整默認處理速度或者默認并發限制?
若在下載速度不影響處理的前提下,智能識別接口默認處理速度約為4倍速(注意:默認截圖間隔1秒),相當于長度為1小時的視頻約在15分鐘左右處理完。 如果視頻量級較大且穩定,可以聯系您的騰訊商務提出調整處理速度和并發限制的申請。直播處理時延可以控制在1~2秒內。
?
為什么視頻中目標人物是連續出現的但是識別結果是離散的點?
主要考慮返回人臉區域的精確性,對應相鄰間隔截圖中識別出的人臉如果人臉區域 IOU > 0.85 默認會進行合并,否則會分開顯示,可以根據用戶要求配置 IOU 自定義合并閾值,用戶也可以根據自身業務場景自行合并。

關于我們

騰訊云計算(北京)有限責任公司是騰訊云的運營主體,提供包括云服務器、數據庫、人工智能、容器服務等在內的300多款云計算產品。公司依托騰訊強大的技術積累,構建了覆蓋全球的云計算基礎設施,致力于幫助企業實現數字化轉型,推動產業升級。騰訊云以安全、穩定、高效的服務,贏得了眾多行業客戶的信任,成為推動數字經濟發展的重要力量。
聯系信息
服務時間:
7*24
電話號碼:
+86 755 8601 3388
電話號碼:
+1 844 606 0804(美國)
電話號碼:
+44 808 196 4551(英國)
郵箱:
cloudlegalnotices@tencent.com
網頁在線客服:
咨詢
為何選擇騰訊云
了解各行各業的領先企業為何選擇騰訊云來解決最艱巨的挑戰。
促進企業數字化轉型 |
豐富行業經驗及業務場景 |
提供以客戶為中心的服務 |
賦能企業面向世界• 全球覆蓋:已開通全球21個地理區域,運營58個可用區,提供超過3200全球CDN節點,為更多企業提供強有力的技術支持,促進業務快速擴張。 |
利用騰訊 C2B 優勢 |
合作客戶
API接口列表

使用指南


依賴服務


產品問答

?
智能識別支持哪些視頻格式?支持音頻嗎?直播流呢?
音頻支持 wav、mp3、aac、flac。 視頻支持 mp4、flv、mkv、avi、rmvb、ts、fmp4 等常見音視頻容器格式。 直播流支持 flv、rtmp、hls、dash等音視頻傳輸協議。 若有其他不常見格式且視頻量較大可以聯系您的騰訊云商務提出申請。
?
何挑選入庫人臉圖片能達到較好的視頻識別結果?
入庫圖片請盡量選擇正面人臉較清晰的單人像照片,圖片格式選擇jpg或png ,像素不低于200X200px。同時,您新增的人臉圖片若越接近需要處理的視頻中目標人物,識別的效果就越好。 若您需要識別目標人物在不同時期且時間間隔跨度較大的視頻,建議新增入庫的目標人物人臉圖片盡量涵蓋該人物不同時期的人像圖片,以便獲得更高的識別準確度。
?
默認處理速度如何?如何申請調整默認處理速度或者默認并發限制?
若在下載速度不影響處理的前提下,智能識別接口默認處理速度約為4倍速(注意:默認截圖間隔1秒),相當于長度為1小時的視頻約在15分鐘左右處理完。 如果視頻量級較大且穩定,可以聯系您的騰訊商務提出調整處理速度和并發限制的申請。直播處理時延可以控制在1~2秒內。
?
為什么視頻中目標人物是連續出現的但是識別結果是離散的點?
主要考慮返回人臉區域的精確性,對應相鄰間隔截圖中識別出的人臉如果人臉區域 IOU > 0.85 默認會進行合并,否則會分開顯示,可以根據用戶要求配置 IOU 自定義合并閾值,用戶也可以根據自身業務場景自行合并。

關于我們

騰訊云計算(北京)有限責任公司是騰訊云的運營主體,提供包括云服務器、數據庫、人工智能、容器服務等在內的300多款云計算產品。公司依托騰訊強大的技術積累,構建了覆蓋全球的云計算基礎設施,致力于幫助企業實現數字化轉型,推動產業升級。騰訊云以安全、穩定、高效的服務,贏得了眾多行業客戶的信任,成為推動數字經濟發展的重要力量。
聯系信息
服務時間:
7*24
電話號碼:
+86 755 8601 3388
電話號碼:
+1 844 606 0804(美國)
電話號碼:
+44 808 196 4551(英國)
郵箱:
cloudlegalnotices@tencent.com
網頁在線客服:
咨詢
為何選擇騰訊云
了解各行各業的領先企業為何選擇騰訊云來解決最艱巨的挑戰。
促進企業數字化轉型 |
豐富行業經驗及業務場景 |
提供以客戶為中心的服務 |
賦能企業面向世界• 全球覆蓋:已開通全球21個地理區域,運營58個可用區,提供超過3200全球CDN節點,為更多企業提供強有力的技術支持,促進業務快速擴張。 |
利用騰訊 C2B 優勢 |
合作客戶

合作案例
