![]() |
Adobe PDF 提取服務(wù)
專用API
【更新時間: 2024.08.13】
Adobe PDF 提取 API使用由 Adob??e Sensei 機(jī)器學(xué)習(xí)提供支持的 Web 服務(wù)解鎖任何 PDF 的結(jié)構(gòu)和內(nèi)容元素。
|
瀏覽次數(shù)
35
采購人數(shù)
1
試用次數(shù)
1
試用
收藏
×
完成
取消
×
書簽名稱
確定
|
- API詳情
- 定價
- 使用指南
- 常見 FAQ
- 關(guān)于我們
- 相關(guān)推薦


什么是Adobe PDF 提取服務(wù)?
"Adobe PDF 提取服務(wù)"是一種基于 Adobe Sensei 機(jī)器學(xué)習(xí)技術(shù)的 Web 服務(wù),旨在解鎖 PDF 文檔的結(jié)構(gòu)和內(nèi)容元素。該服務(wù)通過 Adobe PDF Extract API 提供,允許用戶從任何 PDF 文件中提取結(jié)構(gòu)化數(shù)據(jù),包括文本、表格、圖像等,并將這些數(shù)據(jù)以 JSON、CSV、XLSX 或 PNG 等格式輸出。這使得用戶能夠輕松地在各種下游系統(tǒng)中存儲、分析和操作這些數(shù)據(jù)。
什么是Adobe PDF 提取服務(wù)接口?
Adobe PDF 提取服務(wù)有哪些核心功能?
![]() |
![]() |
![]() |
![]() |
全面的內(nèi)容提取
|
文檔結(jié)構(gòu)理解 對可能跨多列或多頁的文本對象(如標(biāo)題、列表、腳注和段落)進(jìn)行分類。捕獲所有對象的文本字體和樣式、定位和自然閱讀順序。 |
高度準(zhǔn)確的結(jié)果 Adobe Sensei AI 技術(shù)可在多種文檔類型(原生 PDF 和掃描 PDF)中提供高度準(zhǔn)確的數(shù)據(jù)提取,而無需自定義 ML 模板或模型訓(xùn)練。 |
平臺無關(guān)
|
Adobe PDF 提取服務(wù)的核心優(yōu)勢是什么?
-
全面的內(nèi)容提取:Adobe PDF 提取服務(wù)能夠提取 PDF 文檔中的所有元素,包括文本、表格和圖像,并以結(jié)構(gòu)化的 JSON 文件形式輸出。這種全面的內(nèi)容提取能力支持各種下游解決方案,如數(shù)據(jù)分析、內(nèi)容重新發(fā)布等。
-
文檔結(jié)構(gòu)理解:借助 Adobe Sensei AI 技術(shù),該服務(wù)能夠深入理解文檔結(jié)構(gòu),包括元素的識別、位置、相對于其他元素的連接以及自然閱讀順序。這使得提取的數(shù)據(jù)更加準(zhǔn)確和有用。
-
高度準(zhǔn)確的結(jié)果:Adobe Sensei AI 技術(shù)在多種文檔類型(原生 PDF 和掃描 PDF)中提供高度準(zhǔn)確的數(shù)據(jù)提取,而無需用戶自定義 ML 模板或進(jìn)行模型訓(xùn)練。這大大降低了使用門檻,提高了工作效率。
-
平臺無關(guān):Adobe PDF Extract API 是 RESTful 風(fēng)格的,可以與任何云平臺或內(nèi)部部署應(yīng)用程序無縫集成。這種靈活性使得該服務(wù)能夠廣泛應(yīng)用于各種場景和環(huán)境中。
-
安全性:Adobe 非常重視用戶數(shù)據(jù)的安全性,提供了全面的安全概述和保障措施,確保用戶在使用該服務(wù)時數(shù)據(jù)的安全性和隱私性。
-
易用性:用戶可以從免費(fèi)套餐開始,每月獲得一定數(shù)量的免費(fèi)文檔交易。此外,Adobe 還提供了可立即運(yùn)行的示例代碼和交互式演示,幫助用戶快速上手并體驗 API 的強(qiáng)大功能。
在哪些場景會用到Adobe PDF 提取服務(wù)?
![]() |
![]() |
![]() |
內(nèi)容處理 快速準(zhǔn)確地從原生和掃描的 PDF 中提取數(shù)據(jù)和上下文,以使用機(jī)器人流程自動化 (RPA) 和自然語言處理 (NLP) 等技術(shù)實現(xiàn)下游流程的自動化。 |
數(shù)據(jù)分析
|
內(nèi)容重新發(fā)布 通過提取數(shù)據(jù)、結(jié)構(gòu)上下文、文本和表格格式以及閱讀順序,以不同的媒體、語言和格式重新發(fā)布 PDF 文檔中的內(nèi)容。 |




步驟 1:獲取訪問令牌
PDF 服務(wù) API 端點是經(jīng)過身份驗證的端點。獲取訪問令牌分為兩個步驟:
- 獲取憑據(jù) 調(diào)用 PDF 服務(wù) API 需要 Adob??e 提供的憑據(jù)。要獲取憑據(jù),請單擊此處并完成工作流程。請務(wù)必將憑據(jù)值復(fù)制并保存到安全位置。
- 檢索訪問令牌PDF 服務(wù) API 需要 access_token 來授權(quán)請求??。使用 Postman Collection 中的“獲取 AccessToken”API 以及您的 client_id、client_secret(在 1 中下載的 pdfservices-api-credentials.json 文件中提到)來獲取 access_token,或者直接使用下面提到的 cURL 來獲取 access_token。
步驟 2:上傳資產(chǎn)
獲取訪問令牌后,我們需要上傳資產(chǎn)。上傳資產(chǎn)分為兩個步驟:
- 首先您需要使用以下 API 獲取上傳預(yù)簽名 URI。
- 從上述 API獲取響應(yīng)狀態(tài)后,使用
uploadUri
上述 API 響應(yīng)主體中的字段,通過 PUT API 調(diào)用將資產(chǎn)直接上傳到云提供商。您還將獲得一個assetID
用于創(chuàng)建作業(yè)的字段。
步驟 3:創(chuàng)建作業(yè)
要為操作創(chuàng)建作業(yè),請 assetID
在 API 請求正文中使用步驟 2 中獲得的。成功提交作業(yè)后,您將獲得狀態(tài)代碼和將用于輪詢的響應(yīng)標(biāo)頭。
要創(chuàng)建作業(yè),請參閱特定PDF 操作的相應(yīng) API 規(guī)范。
步驟 4:獲取狀態(tài)
成功創(chuàng)建作業(yè)后,您需要location
使用以下 API 輪詢步驟 3 中返回的響應(yīng)標(biāo)頭
步驟 5:下載資產(chǎn)
從輪詢 API獲取響應(yīng)代碼后,您將
status
在響應(yīng)正文中收到一個字段,該字段可以是in progress
、done
或failed
。
如果status
字段為in progress,
則需要繼續(xù)輪詢位置,直到它變?yōu)?/span>done
或failed
。
如果該status
字段是done
響應(yīng)主體,則該字段中還會有一個下載預(yù)簽名 URI dowloadUri
,它將用于通過以下 API 調(diào)用直接從云提供商下載資產(chǎn)
指南詳情鏈接:https://developer.adobe.com/document-services/docs/overview/pdf-accessibility-auto-tag-api/gettingstarted/




目標(biāo)是我們的核心
了解我們?nèi)绾闻槭澜鐒?chuàng)造積極的變化。
面向所有人的 Adobe
|
|
|
人人享有創(chuàng)造力 作為一家創(chuàng)意公司,我們獨(dú)特地致力于為全世界的創(chuàng)作者賦能。 |
技術(shù)變革 我們致力于推動負(fù)責(zé)任地使用技術(shù),造福社會。 |
|
![]() |
我們的價值觀 我們的公司價值觀——創(chuàng)造未來、擁有結(jié)果、提高標(biāo)準(zhǔn)和真誠——代表了我們是誰、我們?nèi)绾卧谑澜缟铣霈F(xiàn),以及我們將如何定義我們未來的成功。 |
Adobe 和 AI
Adobe 正在利用人工智能作為副駕駛,使世界更具創(chuàng)造力、生產(chǎn)力和個性化,從而放大人類的聰明才智。




步驟 1:獲取訪問令牌
PDF 服務(wù) API 端點是經(jīng)過身份驗證的端點。獲取訪問令牌分為兩個步驟:
- 獲取憑據(jù) 調(diào)用 PDF 服務(wù) API 需要 Adob??e 提供的憑據(jù)。要獲取憑據(jù),請單擊此處并完成工作流程。請務(wù)必將憑據(jù)值復(fù)制并保存到安全位置。
- 檢索訪問令牌PDF 服務(wù) API 需要 access_token 來授權(quán)請求??。使用 Postman Collection 中的“獲取 AccessToken”API 以及您的 client_id、client_secret(在 1 中下載的 pdfservices-api-credentials.json 文件中提到)來獲取 access_token,或者直接使用下面提到的 cURL 來獲取 access_token。
步驟 2:上傳資產(chǎn)
獲取訪問令牌后,我們需要上傳資產(chǎn)。上傳資產(chǎn)分為兩個步驟:
- 首先您需要使用以下 API 獲取上傳預(yù)簽名 URI。
- 從上述 API獲取響應(yīng)狀態(tài)后,使用
uploadUri
上述 API 響應(yīng)主體中的字段,通過 PUT API 調(diào)用將資產(chǎn)直接上傳到云提供商。您還將獲得一個assetID
用于創(chuàng)建作業(yè)的字段。
步驟 3:創(chuàng)建作業(yè)
要為操作創(chuàng)建作業(yè),請 assetID
在 API 請求正文中使用步驟 2 中獲得的。成功提交作業(yè)后,您將獲得狀態(tài)代碼和將用于輪詢的響應(yīng)標(biāo)頭。
要創(chuàng)建作業(yè),請參閱特定PDF 操作的相應(yīng) API 規(guī)范。
步驟 4:獲取狀態(tài)
成功創(chuàng)建作業(yè)后,您需要location
使用以下 API 輪詢步驟 3 中返回的響應(yīng)標(biāo)頭
步驟 5:下載資產(chǎn)
從輪詢 API獲取響應(yīng)代碼后,您將
status
在響應(yīng)正文中收到一個字段,該字段可以是in progress
、done
或failed
。
如果status
字段為in progress,
則需要繼續(xù)輪詢位置,直到它變?yōu)?/span>done
或failed
。
如果該status
字段是done
響應(yīng)主體,則該字段中還會有一個下載預(yù)簽名 URI dowloadUri
,它將用于通過以下 API 調(diào)用直接從云提供商下載資產(chǎn)
指南詳情鏈接:https://developer.adobe.com/document-services/docs/overview/pdf-accessibility-auto-tag-api/gettingstarted/






目標(biāo)是我們的核心
了解我們?nèi)绾闻槭澜鐒?chuàng)造積極的變化。
面向所有人的 Adobe
|
|
|
人人享有創(chuàng)造力 作為一家創(chuàng)意公司,我們獨(dú)特地致力于為全世界的創(chuàng)作者賦能。 |
技術(shù)變革 我們致力于推動負(fù)責(zé)任地使用技術(shù),造福社會。 |
|
![]() |
我們的價值觀 我們的公司價值觀——創(chuàng)造未來、擁有結(jié)果、提高標(biāo)準(zhǔn)和真誠——代表了我們是誰、我們?nèi)绾卧谑澜缟铣霈F(xiàn),以及我們將如何定義我們未來的成功。 |
Adobe 和 AI
Adobe 正在利用人工智能作為副駕駛,使世界更具創(chuàng)造力、生產(chǎn)力和個性化,從而放大人類的聰明才智。