圖片翻譯-百度
專用API
【更新時間: 2023.12.25】
圖片文字識別+翻譯:集成圖片文字識別與文本翻譯,支持語種自動檢測
實景回填:支持實景回填,返回圖片結果
咨詢
去服務商官網采購>
|
瀏覽次數
64
采購人數
1
試用次數
0
試用
收藏
×
完成
取消
×
書簽名稱
確定
|
相似API
TLDWai.com
59
TLDWai.com 能夠助力用戶在 TLDWai.com 系統中更為便捷輕松地運用 AI 來制作視頻摘要。它旨在為用戶提供高效且優質的服務,使用戶可以順利且簡單地完成視頻摘要的制作過程,提升用戶體驗。
Translator
110
Translator 能夠出色地實現文本的翻譯功能,其強大之處在于支持多種不同語言之間的相互翻譯,無論是常見語種還是小語種,都能準確且高效地完成翻譯任務,為用戶提供便捷的語言轉換服務。
DeepL翻譯服務-企業級翻譯
1.3K
DeepL API為你提供對DeepL機器翻譯技術的程序化訪問,使你得以直接在你的網站上和應用程序中應用其高水準翻譯能力。
- API詳情
- 使用指南
- 常見 FAQ
- 關于我們
- 相關推薦

產品介紹

什么是百度的圖片翻譯?
圖片翻譯API結合OCR及機器翻譯技術,可以對圖片中的文本內容進行文字識別、語種自動檢測并翻譯成目標語言,支持譯文實景回填。基于業界領先的深度學習技術及翻譯技術,提供多場景、多語種、高精度的整圖識別+翻譯服務。您只需傳入圖片,即可識別圖片中的文字并進行翻譯。
什么是百度的圖片翻譯接口?
由服務使用方的應用程序發起,以Restful風格為主、通過公網HTTP協議調用百度的圖片翻譯,從而實現程序的自動化交互,提高服務效率。
百度的圖片翻譯有哪些核心功能?
- 圖片文字識別+翻譯:集成圖片文字識別與文本翻譯,支持語種自動檢測
-
實景回填:支持實景回填,返回圖片結果
百度的圖片翻譯的核心優勢是什么?
- 技術領先:依托百度先進的文字識別及機器翻譯技術,滿足多場景下圖片翻譯需求
- 接入方便:支持跨平臺API調用,避免繁瑣的二次接入
在哪些場景會用到百度的圖片翻譯?
出國旅游:出國旅游時,面對不認識的菜單、路標、廣告牌等, 拍照立現翻譯結果,語言從此不再是障礙。 |
|
學習辦公:在外語學習、科研講座、瀏覽文檔和網頁等場景, 拍照或截圖快速完成圖片翻譯,提高學習和工作效率。 |

使用指南


產品問答

?
需要使用什么賬號登錄?
您需要擁有一個百度賬號,用來登錄百度云,可以點擊此處注冊百度賬戶。如您以前擁有百度推廣賬戶,同樣可以登錄百度云。
?
注冊百度賬戶時收不到驗證碼怎么辦?
由于欠費停機、存儲信息已滿、信號網絡延遲等原因沒有及時收到驗證碼,這時請檢查您的手機及話費余額,保證手機可正常接收短信后,請嘗試重新獲取驗證碼。
?
每個服務的請求配額都是免費的么?
目前我們為每個賬戶下的每項API服務,都設置了固定的免費請求配額,便于您體驗服務及應用調試。在免費試用階段,成功調用或失敗調用都算做一次有效調用,會消耗免費測試資源。
?
每個服務的請求配額有限制么?
目前在同一賬號下,您可以在對應服務的控制臺中查看。付費服務不限請求數量,即用即扣。
?
QPS超限怎么辦?
QPS超限可以根據您的需求,進行購買。百度AI技術服務的詳細價目表: https://ai.baidu.com/ai-doc/REFERENCE/hk3dwjfzo 價目表包含:免費測試資源、計費簡介、計費價目表、費用列舉等。
?
支持哪些語言的服務端SDK?
目前支持各項服務的Java、PHP、Python、C#、Node.js版本服務端SDK,部分技術推出了C++、IOS、Android等版本服務端SDK,詳情請參見各技術服務SDK文檔。
?
什么是base64編碼,如何提供?
圖片的base64編碼指將一副圖片數據編碼成一串字符串,使用該字符串代替圖像地址。您可以首先得到圖片的二進制,然后用Base64格式編碼即可。注:圖片的base64編碼是不包含圖片頭的,(data:image/jpg;base64,)。
?
識別的圖片格式有什么要求?
支持PNG、JPG、JPEG、BMP等格式圖片,暫不支持 GIF 類型的動圖識別。
?
文字識別的并發量上限是多少?
大部分文字識別接口在未開通付費時提供2QPS額度,開通付費后提升至10QPS,如果您有更高并發需求,可購買QPS疊加包進行擴充。對于已上線但沒有價格的產品,暫屬于測試狀態,當測試額度不足時,您可以提交工單進行申請,您需要在工單提供您的appid、業務場景描述、需要的接口名稱和申請的并發量。
?
如何購買/提升調用次數?
已上線計費的接口,您可以直接在控制臺購買次數包或開通按量后付費,計費價格參見產品價格;未上線計費的接口,您可以提交工單進行申請,您需要在工單提供您的appid、業務場景描述、需要的接口名稱和申請的調用次數。
?
文字識別對上傳的圖片格式、圖片大小有哪些要求?
支持 JPG、JPEG、PNG、BMP、TIF、WebP 等格式圖片,暫不支持 GIF 類型的動圖識別。 一般情況下,圖像base64編碼后大小必須小于4M,建議不要超過1M;最小邊長不小于15,最大邊長不超過4096,建議不要超過1024(編碼后大于1M或最大邊長超過1024的圖像會被等比壓縮,建議控制輸入圖像大小,有助于減少網絡傳輸及接口處理耗時)。但是不同的功能接口,對于圖片大小的要求可能不同,具體以相應的API文檔中的 Image 和 url 參數說明為準。
?
怎么提高識別的準確率和識別速度?
文字識別的準確率跟拍攝光照、背景、清晰度等因素有關。推薦上傳JPG圖片格式,圖片大小建議1M以內??稍趫D片采集端盡量擴大要識別文字的區域,并保證圖片內文字清晰人眼可辨認、傾斜度不得小于30%。同時,適當壓縮圖片大小,可大幅縮短圖片識別時間。
?
文字識別支持的語言?
不同的功能接口,所支持的語言都不同。常見多語言識別接口如下: 通用文字識別(標準版)、通用文字識別(標準含位置版):支持中文簡體、中文繁體、英文、日語、韓語、法語、西班牙語、葡萄牙語、德語、意大利語、俄語。 通用文字識別(高精度版)、通用文字識別(高精度含位置版):支持中文簡體、中文繁體、英文、日語、韓語、法語、西班牙語、葡萄牙語、德語、意大利語、俄語、丹麥語、荷蘭語、馬來語、瑞典語、印尼語、波蘭語、羅馬尼亞語、土耳其語、希臘語、匈牙利語。 其他接口(除國內專用卡證票據外)基本均可支持中、英文內容識別。詳細參見API文檔。 如果您對于產品支持識別的語言有特殊需求,您可以提交工單聯系我們。
?
文字識別是否支持方向旋轉/不同朝向的圖片文字識別?
文字識別大部分能力均已支持圖像方向自動校正功能,可對旋轉的圖片進行正確的識別,也可通過控制參數『detect_direction』為true/false控制該功能是否開啟。如果您在使用中存在部分旋轉圖片無法正確識別的問題,您可以提交工單告知我們進行優化。
?
圖片格式和分辨率有限制嗎?
目前圖片格式支持PNG、JPG、JPEG、BMP、GIF(僅對首幀進行審核)、Webp、TIFF;圖像要求base64后大于等于5KB,小于等于4MB,最短邊大于等于128像素,小于等于4096像素。
?
圖片大小有限制嗎?
圖像URL地址,以URL形式請求,圖像Url需要做UrlEncode,圖像要求base64后大于等于5kb, 小于等于4M,最短邊大于等于128像素,小于等于4096像素。
?
識別的圖片支持怎樣輸入?
支持傳輸Base64編碼后的圖片或者圖片的URL。
?
什么是base64編碼,如何提供?
圖片的base64編碼指將一副圖片數據編碼成一串字符串,使用該字符串代替圖像地址。您可以首先得到圖片的二進制,然后用Base64格式編碼即可。注:圖片的base64編碼是不包含圖片頭的,如(data:image/jpg;base64,)。
?
是否支持通過URL方式傳入圖片?
支持。您可以通過圖像審核組合服務接口,使用該服務。
?
圖像識別接口可以識別哪些圖像?
圖像識別接口可支持通用物體和場景識別、品牌logo識別、動物識別、植物識別、菜品識別、地標識別、果蔬識別、紅酒識別、貨幣識別、圖像主體識別、翻拍識別、快消商品檢測等。詳情鏈接:https://ai.baidu.com/tech/imagerecognition

關于我們

北京百度網訊科技有限公司
企業
北京百度網訊科技有限公司,是百度旗下公司,擁有網頁搜索、hao123、百度推廣等多條業務線。百度將“讓人們最平等、便捷地獲取信息,找到所求”作為自己的使命,致力于為用戶提供“簡單可依賴”的互聯網搜索產品及服務。百度是全球最大的中文搜索引擎、最大的中文網站,2000年1月創立于北京中關村。1999年底,身在美國硅谷的李彥宏看到了中國互聯網及中文搜索引擎服務的巨大發展潛力,抱著技術改變世界的夢想,他毅然辭掉硅谷的高薪工作,攜搜索引擎專利技術,于2000年1月1日在中關村創建了百度公司。從最初的不足10人發展至今,員工人數超過18000人。如今的百度,已成為中國最受歡迎、影響力最大的中文網站。百度擁有數千名研發工程師,這是中國乃至全球最為優秀的技術團隊,這支隊伍掌握著世界上最為先進的搜索引擎技術,使百度成為中國掌握世界尖端科學核心技術的中國高科技企業,也使中國成為美國、俄羅斯、和韓國之外,全球僅有的4個擁有搜索引擎核心技術的國家之一。
聯系信息
電話號碼:
+86 10 5992 8888
百度地圖憑借其卓越的產品服務、深入的行業耕耘、尖端的專業技術以及開放的平臺生態,為政企開發者提供堅實可靠的地圖數字底座。
API接口列表

使用指南


依賴服務


產品問答

?
需要使用什么賬號登錄?
您需要擁有一個百度賬號,用來登錄百度云,可以點擊此處注冊百度賬戶。如您以前擁有百度推廣賬戶,同樣可以登錄百度云。
?
注冊百度賬戶時收不到驗證碼怎么辦?
由于欠費停機、存儲信息已滿、信號網絡延遲等原因沒有及時收到驗證碼,這時請檢查您的手機及話費余額,保證手機可正常接收短信后,請嘗試重新獲取驗證碼。
?
每個服務的請求配額都是免費的么?
目前我們為每個賬戶下的每項API服務,都設置了固定的免費請求配額,便于您體驗服務及應用調試。在免費試用階段,成功調用或失敗調用都算做一次有效調用,會消耗免費測試資源。
?
每個服務的請求配額有限制么?
目前在同一賬號下,您可以在對應服務的控制臺中查看。付費服務不限請求數量,即用即扣。
?
QPS超限怎么辦?
QPS超限可以根據您的需求,進行購買。百度AI技術服務的詳細價目表: https://ai.baidu.com/ai-doc/REFERENCE/hk3dwjfzo 價目表包含:免費測試資源、計費簡介、計費價目表、費用列舉等。
?
支持哪些語言的服務端SDK?
目前支持各項服務的Java、PHP、Python、C#、Node.js版本服務端SDK,部分技術推出了C++、IOS、Android等版本服務端SDK,詳情請參見各技術服務SDK文檔。
?
什么是base64編碼,如何提供?
圖片的base64編碼指將一副圖片數據編碼成一串字符串,使用該字符串代替圖像地址。您可以首先得到圖片的二進制,然后用Base64格式編碼即可。注:圖片的base64編碼是不包含圖片頭的,(data:image/jpg;base64,)。
?
識別的圖片格式有什么要求?
支持PNG、JPG、JPEG、BMP等格式圖片,暫不支持 GIF 類型的動圖識別。
?
文字識別的并發量上限是多少?
大部分文字識別接口在未開通付費時提供2QPS額度,開通付費后提升至10QPS,如果您有更高并發需求,可購買QPS疊加包進行擴充。對于已上線但沒有價格的產品,暫屬于測試狀態,當測試額度不足時,您可以提交工單進行申請,您需要在工單提供您的appid、業務場景描述、需要的接口名稱和申請的并發量。
?
如何購買/提升調用次數?
已上線計費的接口,您可以直接在控制臺購買次數包或開通按量后付費,計費價格參見產品價格;未上線計費的接口,您可以提交工單進行申請,您需要在工單提供您的appid、業務場景描述、需要的接口名稱和申請的調用次數。
?
文字識別對上傳的圖片格式、圖片大小有哪些要求?
支持 JPG、JPEG、PNG、BMP、TIF、WebP 等格式圖片,暫不支持 GIF 類型的動圖識別。 一般情況下,圖像base64編碼后大小必須小于4M,建議不要超過1M;最小邊長不小于15,最大邊長不超過4096,建議不要超過1024(編碼后大于1M或最大邊長超過1024的圖像會被等比壓縮,建議控制輸入圖像大小,有助于減少網絡傳輸及接口處理耗時)。但是不同的功能接口,對于圖片大小的要求可能不同,具體以相應的API文檔中的 Image 和 url 參數說明為準。
?
怎么提高識別的準確率和識別速度?
文字識別的準確率跟拍攝光照、背景、清晰度等因素有關。推薦上傳JPG圖片格式,圖片大小建議1M以內。可在圖片采集端盡量擴大要識別文字的區域,并保證圖片內文字清晰人眼可辨認、傾斜度不得小于30%。同時,適當壓縮圖片大小,可大幅縮短圖片識別時間。
?
文字識別支持的語言?
不同的功能接口,所支持的語言都不同。常見多語言識別接口如下: 通用文字識別(標準版)、通用文字識別(標準含位置版):支持中文簡體、中文繁體、英文、日語、韓語、法語、西班牙語、葡萄牙語、德語、意大利語、俄語。 通用文字識別(高精度版)、通用文字識別(高精度含位置版):支持中文簡體、中文繁體、英文、日語、韓語、法語、西班牙語、葡萄牙語、德語、意大利語、俄語、丹麥語、荷蘭語、馬來語、瑞典語、印尼語、波蘭語、羅馬尼亞語、土耳其語、希臘語、匈牙利語。 其他接口(除國內專用卡證票據外)基本均可支持中、英文內容識別。詳細參見API文檔。 如果您對于產品支持識別的語言有特殊需求,您可以提交工單聯系我們。
?
文字識別是否支持方向旋轉/不同朝向的圖片文字識別?
文字識別大部分能力均已支持圖像方向自動校正功能,可對旋轉的圖片進行正確的識別,也可通過控制參數『detect_direction』為true/false控制該功能是否開啟。如果您在使用中存在部分旋轉圖片無法正確識別的問題,您可以提交工單告知我們進行優化。
?
圖片格式和分辨率有限制嗎?
目前圖片格式支持PNG、JPG、JPEG、BMP、GIF(僅對首幀進行審核)、Webp、TIFF;圖像要求base64后大于等于5KB,小于等于4MB,最短邊大于等于128像素,小于等于4096像素。
?
圖片大小有限制嗎?
圖像URL地址,以URL形式請求,圖像Url需要做UrlEncode,圖像要求base64后大于等于5kb, 小于等于4M,最短邊大于等于128像素,小于等于4096像素。
?
識別的圖片支持怎樣輸入?
支持傳輸Base64編碼后的圖片或者圖片的URL。
?
什么是base64編碼,如何提供?
圖片的base64編碼指將一副圖片數據編碼成一串字符串,使用該字符串代替圖像地址。您可以首先得到圖片的二進制,然后用Base64格式編碼即可。注:圖片的base64編碼是不包含圖片頭的,如(data:image/jpg;base64,)。
?
是否支持通過URL方式傳入圖片?
支持。您可以通過圖像審核組合服務接口,使用該服務。
?
圖像識別接口可以識別哪些圖像?
圖像識別接口可支持通用物體和場景識別、品牌logo識別、動物識別、植物識別、菜品識別、地標識別、果蔬識別、紅酒識別、貨幣識別、圖像主體識別、翻拍識別、快消商品檢測等。詳情鏈接:https://ai.baidu.com/tech/imagerecognition

關于我們

北京百度網訊科技有限公司
企業
北京百度網訊科技有限公司,是百度旗下公司,擁有網頁搜索、hao123、百度推廣等多條業務線。百度將“讓人們最平等、便捷地獲取信息,找到所求”作為自己的使命,致力于為用戶提供“簡單可依賴”的互聯網搜索產品及服務。百度是全球最大的中文搜索引擎、最大的中文網站,2000年1月創立于北京中關村。1999年底,身在美國硅谷的李彥宏看到了中國互聯網及中文搜索引擎服務的巨大發展潛力,抱著技術改變世界的夢想,他毅然辭掉硅谷的高薪工作,攜搜索引擎專利技術,于2000年1月1日在中關村創建了百度公司。從最初的不足10人發展至今,員工人數超過18000人。如今的百度,已成為中國最受歡迎、影響力最大的中文網站。百度擁有數千名研發工程師,這是中國乃至全球最為優秀的技術團隊,這支隊伍掌握著世界上最為先進的搜索引擎技術,使百度成為中國掌握世界尖端科學核心技術的中國高科技企業,也使中國成為美國、俄羅斯、和韓國之外,全球僅有的4個擁有搜索引擎核心技術的國家之一。
聯系信息
電話號碼:
+86 10 5992 8888
百度地圖憑借其卓越的產品服務、深入的行業耕耘、尖端的專業技術以及開放的平臺生態,為政企開發者提供堅實可靠的地圖數字底座。

合作案例
