圖像內容理解-百度智能云
專用API
【更新時間: 2024.06.25】
圖像理解視覺大模型,可多維度識別與理解圖片內容,包括人、物、行為、場景、文字等,支持輸出對圖片內容的一句話描述,同時返回圖片的分類標簽、文字內容等信息
咨詢
去服務商官網采購>
|
瀏覽次數
110
采購人數
1
試用次數
0
收藏
×
完成
取消
×
書簽名稱
確定
|
- API詳情
- 使用指南
- 常見 FAQ
- 關于我們
- 相關推薦


什么是百度智能云的圖像內容理解?
圖像內容理解是一種基于先進視覺大模型的技術,能夠多維度地識別并理解圖片中的豐富信息。它不僅能夠分析圖片中的人、物體、行為、場景以及文字,還能通過整合這些信息,輸出對整個圖片內容的精確描述。這種技術通常與強大的語言處理模型結合,使得機器能夠進行看圖問答、視覺推理等復雜任務,為用戶提供一種類似人類的視覺理解能力。
什么是百度智能云的圖像內容理解接口?
百度智能云的圖像內容理解有哪些核心功能?
圖片理解與內容描述
多維度理解圖片內容,支持輸出對圖片內容的一句話描述,結合大語言模型,可應用于看圖問答、視覺推理等場景
|
物體和場景全識別
識別動物、植物、商品、建筑、風景、動漫、食材、公眾人物等10萬個常見物體及場景,支持拼接返回大類及細分類名稱
|
圖片文字全識別
檢測并識別圖片內的全部文字信息,涵蓋文檔、證件等常見場景,支持輸出文字內容及文字位置
|
百度智能云的圖像內容理解的核心優勢是什么?
內容準確
依托圖像理解視覺大模型,可精準提煉出對圖片的描述,提供更精細、精準的理解服務
|
服務穩定
提供高可靠性、彈性可伸縮、高并發承載的公有云服務,服務可用性高達99.9%以上
|
簡單易用
標準化接口封裝,調用簡單,只需上傳單張圖片,秒級別獲取識別結果
|
在哪些場景會用到百度智能云的圖像內容理解?
多模態組件提供
支持作為 AI 能力組件,結合大語言模型無縫理解圖像信息,讓大模型真正具備“視覺感官”,補齊大語言模型的視覺推理能力
|
|
趣味看圖對話
結合大語言模型,可基于圖片內容進行問答對話,提高用戶交互體驗,廣泛應用于智能手機廠商、拍照識圖、趣味科普等場景
|
|
內容智能推薦
基于模型為圖片添加的標簽,可推薦相關的話題或用戶,支持用于自動標簽、圖片分類和內容推薦等場景
|
|


1. 成為開發者
三步完成賬號的基本注冊與認證:
STEP1:點擊百度AI開放平臺導航右側的控制臺,選擇需要使用的AI服務項。若為未登錄狀態,將跳轉至登錄界面,請您使用百度賬號登錄。如還未持有百度賬戶,可以點擊此處注冊百度賬戶。
STEP2:首次使用,登錄后將會進入開發者認證頁面,請填寫相關信息完成開發者認證。注:(如您之前已經是百度云用戶或百度開發者中心用戶,此步可略過)。
STEP3:通過控制臺左側導航,選擇產品服務-人工智能,進入具體AI服務項的控制面板(如文字識別、人臉識別),進行相關業務操作。
2. 創建應用
賬號登錄成功,您需要創建應用才可正式調用AI能力。應用是您調用API服務的基本操作單元,您可以基于應用創建成功后獲取的API Key及Secret Key,進行接口調用操作,及相關配置。
以人臉識別為例,您可按照下圖所示的操作流程,完成創建操作。
兩種入口只是展現形式不同,相關AI服務模塊內容完全一樣 點擊上圖中的「創建應用」,即可進入應用創建界面,如下圖所示:
兩種入口只是展現形式不同,相關AI服務模塊內容完全一樣 創建應用需填寫的內容如下:
應用名稱: 必填項,用于標識您所創建的應用的名稱,支持中英文、數字、下劃線及中橫線,此名稱一經創建完畢,不可修改;
接口選擇: 必填項,每個應用可以勾選業務所需的所有AI服務的接口權限(僅可勾選具備免費試用權限的接口能力),應用權限可跨服務勾選,創建應用完畢,此應用即具備了所勾選服務的調用權限;
包名綁定: 選填項,如果您需要使用OCR、AR及語音客戶端SDK服務(iOS/Android),需要綁定包名信息,以便生成授權License,上圖中勾選了「通用文字識別」權限后,即展現此項。 注:人臉識別客戶端SDK需要單獨申請使用,無需在此配置;
應用描述: 必填項,對此應用的業務場景進行描述。
以上內容根據您的需要,填寫完畢后,即可點擊「立即創建」,完成應用的創建。應用創建完畢后,您可以點擊左側導航中的「應用列表」,進行應用查看,如下圖紅框部分所示:
兩種入口只是展現形式不同,相關AI服務模塊內容完全一樣
溫馨提示:每項服務最多創建100個應用,同一賬號下,每項服務都有一定請求限額,該限額所有應用共享。每項服務的請求限額可以在該服務控制臺的概覽頁查看,通常包含調用量請求限額與QPS限額。
3. 獲取密鑰
在您創建完畢應用后,平臺將會分配給您此應用的相關憑證,主要為AppID、API Key、Secret Key。以上三個信息是您應用實際開發的主要憑證,每個應用之間各不相同,請您妥善保管。下圖為示例內容:
兩種入口只是展現形式不同,相關AI服務模塊內容完全一樣
4. 生成簽名
您需要使用創建應用所分配到的AppID、API Key及Secret Key,進行Access Token(用戶身份驗證和授權的憑證)的生成,方法詳見 Access Token獲取,我們為您準備了幾種常見語言的請求示例代碼。
溫馨提示:Access Token的有效期為30天(以秒為單位),請您集成時注意在程序中定期請求新的token。
5. 啟動開發
目前AI產品主要有兩種方式使用:API與SDK,您可以選擇各產品的文檔,查看具體使用方法及參數。 語音識別 | 語音合成 | 文字識別 | 人臉識別 | 人體分析 | 圖像識別 | 圖像搜索 | 圖像增強與特效 | 車輛分析| 圖像審核 | 語言與知識 | 文本審核 | 增強現實AR
同時,我們也為您提供集成多項能力的解決方案,如 智能對話平臺UNIT | 智能創作平臺,您可以查看文檔了解具體使用方法。
SDK下載可以直接點擊這里進入,選擇您需要的SDK進行下載。其中,人臉客戶端SDK需要申請才可使用,請直接:點擊此處申請
詳情參考:https://ai.baidu.com/ai-doc/REFERENCE/Ck3dwjgn3




安全合規可信的云服務 |
||||


1. 成為開發者
三步完成賬號的基本注冊與認證:
STEP1:點擊百度AI開放平臺導航右側的控制臺,選擇需要使用的AI服務項。若為未登錄狀態,將跳轉至登錄界面,請您使用百度賬號登錄。如還未持有百度賬戶,可以點擊此處注冊百度賬戶。
STEP2:首次使用,登錄后將會進入開發者認證頁面,請填寫相關信息完成開發者認證。注:(如您之前已經是百度云用戶或百度開發者中心用戶,此步可略過)。
STEP3:通過控制臺左側導航,選擇產品服務-人工智能,進入具體AI服務項的控制面板(如文字識別、人臉識別),進行相關業務操作。
2. 創建應用
賬號登錄成功,您需要創建應用才可正式調用AI能力。應用是您調用API服務的基本操作單元,您可以基于應用創建成功后獲取的API Key及Secret Key,進行接口調用操作,及相關配置。
以人臉識別為例,您可按照下圖所示的操作流程,完成創建操作。
兩種入口只是展現形式不同,相關AI服務模塊內容完全一樣 點擊上圖中的「創建應用」,即可進入應用創建界面,如下圖所示:
兩種入口只是展現形式不同,相關AI服務模塊內容完全一樣 創建應用需填寫的內容如下:
應用名稱: 必填項,用于標識您所創建的應用的名稱,支持中英文、數字、下劃線及中橫線,此名稱一經創建完畢,不可修改;
接口選擇: 必填項,每個應用可以勾選業務所需的所有AI服務的接口權限(僅可勾選具備免費試用權限的接口能力),應用權限可跨服務勾選,創建應用完畢,此應用即具備了所勾選服務的調用權限;
包名綁定: 選填項,如果您需要使用OCR、AR及語音客戶端SDK服務(iOS/Android),需要綁定包名信息,以便生成授權License,上圖中勾選了「通用文字識別」權限后,即展現此項。 注:人臉識別客戶端SDK需要單獨申請使用,無需在此配置;
應用描述: 必填項,對此應用的業務場景進行描述。
以上內容根據您的需要,填寫完畢后,即可點擊「立即創建」,完成應用的創建。應用創建完畢后,您可以點擊左側導航中的「應用列表」,進行應用查看,如下圖紅框部分所示:
兩種入口只是展現形式不同,相關AI服務模塊內容完全一樣
溫馨提示:每項服務最多創建100個應用,同一賬號下,每項服務都有一定請求限額,該限額所有應用共享。每項服務的請求限額可以在該服務控制臺的概覽頁查看,通常包含調用量請求限額與QPS限額。
3. 獲取密鑰
在您創建完畢應用后,平臺將會分配給您此應用的相關憑證,主要為AppID、API Key、Secret Key。以上三個信息是您應用實際開發的主要憑證,每個應用之間各不相同,請您妥善保管。下圖為示例內容:
兩種入口只是展現形式不同,相關AI服務模塊內容完全一樣
4. 生成簽名
您需要使用創建應用所分配到的AppID、API Key及Secret Key,進行Access Token(用戶身份驗證和授權的憑證)的生成,方法詳見 Access Token獲取,我們為您準備了幾種常見語言的請求示例代碼。
溫馨提示:Access Token的有效期為30天(以秒為單位),請您集成時注意在程序中定期請求新的token。
5. 啟動開發
目前AI產品主要有兩種方式使用:API與SDK,您可以選擇各產品的文檔,查看具體使用方法及參數。 語音識別 | 語音合成 | 文字識別 | 人臉識別 | 人體分析 | 圖像識別 | 圖像搜索 | 圖像增強與特效 | 車輛分析| 圖像審核 | 語言與知識 | 文本審核 | 增強現實AR
同時,我們也為您提供集成多項能力的解決方案,如 智能對話平臺UNIT | 智能創作平臺,您可以查看文檔了解具體使用方法。
SDK下載可以直接點擊這里進入,選擇您需要的SDK進行下載。其中,人臉客戶端SDK需要申請才可使用,請直接:點擊此處申請
詳情參考:https://ai.baidu.com/ai-doc/REFERENCE/Ck3dwjgn3






安全合規可信的云服務 |
||||


|
|
|
|
|
|
|
|
|
|
|
|