![]() |
Adobe PDF 提取服務
專用API
【更新時間: 2024.08.13】
Adobe PDF 提取 API使用由 Adob??e Sensei 機器學習提供支持的 Web 服務解鎖任何 PDF 的結構和內容元素。
|
瀏覽次數
35
采購人數
1
試用次數
1
試用
收藏
×
完成
取消
×
書簽名稱
確定
|
- API詳情
- 定價
- 使用指南
- 常見 FAQ
- 關于我們
- 相關推薦


什么是Adobe PDF 提取服務?
"Adobe PDF 提取服務"是一種基于 Adobe Sensei 機器學習技術的 Web 服務,旨在解鎖 PDF 文檔的結構和內容元素。該服務通過 Adobe PDF Extract API 提供,允許用戶從任何 PDF 文件中提取結構化數據,包括文本、表格、圖像等,并將這些數據以 JSON、CSV、XLSX 或 PNG 等格式輸出。這使得用戶能夠輕松地在各種下游系統中存儲、分析和操作這些數據。
什么是Adobe PDF 提取服務接口?
Adobe PDF 提取服務有哪些核心功能?
![]() |
![]() |
![]() |
![]() |
全面的內容提取
|
文檔結構理解 對可能跨多列或多頁的文本對象(如標題、列表、腳注和段落)進行分類。捕獲所有對象的文本字體和樣式、定位和自然閱讀順序。 |
高度準確的結果 Adobe Sensei AI 技術可在多種文檔類型(原生 PDF 和掃描 PDF)中提供高度準確的數據提取,而無需自定義 ML 模板或模型訓練。 |
平臺無關
|
Adobe PDF 提取服務的核心優勢是什么?
-
全面的內容提取:Adobe PDF 提取服務能夠提取 PDF 文檔中的所有元素,包括文本、表格和圖像,并以結構化的 JSON 文件形式輸出。這種全面的內容提取能力支持各種下游解決方案,如數據分析、內容重新發布等。
-
文檔結構理解:借助 Adobe Sensei AI 技術,該服務能夠深入理解文檔結構,包括元素的識別、位置、相對于其他元素的連接以及自然閱讀順序。這使得提取的數據更加準確和有用。
-
高度準確的結果:Adobe Sensei AI 技術在多種文檔類型(原生 PDF 和掃描 PDF)中提供高度準確的數據提取,而無需用戶自定義 ML 模板或進行模型訓練。這大大降低了使用門檻,提高了工作效率。
-
平臺無關:Adobe PDF Extract API 是 RESTful 風格的,可以與任何云平臺或內部部署應用程序無縫集成。這種靈活性使得該服務能夠廣泛應用于各種場景和環境中。
-
安全性:Adobe 非常重視用戶數據的安全性,提供了全面的安全概述和保障措施,確保用戶在使用該服務時數據的安全性和隱私性。
-
易用性:用戶可以從免費套餐開始,每月獲得一定數量的免費文檔交易。此外,Adobe 還提供了可立即運行的示例代碼和交互式演示,幫助用戶快速上手并體驗 API 的強大功能。
在哪些場景會用到Adobe PDF 提取服務?
![]() |
![]() |
![]() |
內容處理 快速準確地從原生和掃描的 PDF 中提取數據和上下文,以使用機器人流程自動化 (RPA) 和自然語言處理 (NLP) 等技術實現下游流程的自動化。 |
數據分析
|
內容重新發布 通過提取數據、結構上下文、文本和表格格式以及閱讀順序,以不同的媒體、語言和格式重新發布 PDF 文檔中的內容。 |




步驟 1:獲取訪問令牌
PDF 服務 API 端點是經過身份驗證的端點。獲取訪問令牌分為兩個步驟:
- 獲取憑據 調用 PDF 服務 API 需要 Adob??e 提供的憑據。要獲取憑據,請單擊此處并完成工作流程。請務必將憑據值復制并保存到安全位置。
- 檢索訪問令牌PDF 服務 API 需要 access_token 來授權請求??。使用 Postman Collection 中的“獲取 AccessToken”API 以及您的 client_id、client_secret(在 1 中下載的 pdfservices-api-credentials.json 文件中提到)來獲取 access_token,或者直接使用下面提到的 cURL 來獲取 access_token。
步驟 2:上傳資產
獲取訪問令牌后,我們需要上傳資產。上傳資產分為兩個步驟:
- 首先您需要使用以下 API 獲取上傳預簽名 URI。
- 從上述 API獲取響應狀態后,使用
uploadUri
上述 API 響應主體中的字段,通過 PUT API 調用將資產直接上傳到云提供商。您還將獲得一個assetID
用于創建作業的字段。
步驟 3:創建作業
要為操作創建作業,請 assetID
在 API 請求正文中使用步驟 2 中獲得的。成功提交作業后,您將獲得狀態代碼和將用于輪詢的響應標頭。
要創建作業,請參閱特定PDF 操作的相應 API 規范。
步驟 4:獲取狀態
成功創建作業后,您需要location
使用以下 API 輪詢步驟 3 中返回的響應標頭
步驟 5:下載資產
從輪詢 API獲取響應代碼后,您將
status
在響應正文中收到一個字段,該字段可以是in progress
、done
或failed
。
如果status
字段為in progress,
則需要繼續輪詢位置,直到它變為done
或failed
。
如果該status
字段是done
響應主體,則該字段中還會有一個下載預簽名 URI dowloadUri
,它將用于通過以下 API 調用直接從云提供商下載資產
指南詳情鏈接:https://developer.adobe.com/document-services/docs/overview/pdf-accessibility-auto-tag-api/gettingstarted/




目標是我們的核心
了解我們如何努力為世界創造積極的變化。
面向所有人的 Adobe
|
|
|
人人享有創造力 作為一家創意公司,我們獨特地致力于為全世界的創作者賦能。 |
技術變革 我們致力于推動負責任地使用技術,造福社會。 |
|
![]() |
我們的價值觀 我們的公司價值觀——創造未來、擁有結果、提高標準和真誠——代表了我們是誰、我們如何在世界上出現,以及我們將如何定義我們未來的成功。 |
Adobe 和 AI
Adobe 正在利用人工智能作為副駕駛,使世界更具創造力、生產力和個性化,從而放大人類的聰明才智。




步驟 1:獲取訪問令牌
PDF 服務 API 端點是經過身份驗證的端點。獲取訪問令牌分為兩個步驟:
- 獲取憑據 調用 PDF 服務 API 需要 Adob??e 提供的憑據。要獲取憑據,請單擊此處并完成工作流程。請務必將憑據值復制并保存到安全位置。
- 檢索訪問令牌PDF 服務 API 需要 access_token 來授權請求??。使用 Postman Collection 中的“獲取 AccessToken”API 以及您的 client_id、client_secret(在 1 中下載的 pdfservices-api-credentials.json 文件中提到)來獲取 access_token,或者直接使用下面提到的 cURL 來獲取 access_token。
步驟 2:上傳資產
獲取訪問令牌后,我們需要上傳資產。上傳資產分為兩個步驟:
- 首先您需要使用以下 API 獲取上傳預簽名 URI。
- 從上述 API獲取響應狀態后,使用
uploadUri
上述 API 響應主體中的字段,通過 PUT API 調用將資產直接上傳到云提供商。您還將獲得一個assetID
用于創建作業的字段。
步驟 3:創建作業
要為操作創建作業,請 assetID
在 API 請求正文中使用步驟 2 中獲得的。成功提交作業后,您將獲得狀態代碼和將用于輪詢的響應標頭。
要創建作業,請參閱特定PDF 操作的相應 API 規范。
步驟 4:獲取狀態
成功創建作業后,您需要location
使用以下 API 輪詢步驟 3 中返回的響應標頭
步驟 5:下載資產
從輪詢 API獲取響應代碼后,您將
status
在響應正文中收到一個字段,該字段可以是in progress
、done
或failed
。
如果status
字段為in progress,
則需要繼續輪詢位置,直到它變為done
或failed
。
如果該status
字段是done
響應主體,則該字段中還會有一個下載預簽名 URI dowloadUri
,它將用于通過以下 API 調用直接從云提供商下載資產
指南詳情鏈接:https://developer.adobe.com/document-services/docs/overview/pdf-accessibility-auto-tag-api/gettingstarted/






目標是我們的核心
了解我們如何努力為世界創造積極的變化。
面向所有人的 Adobe
|
|
|
人人享有創造力 作為一家創意公司,我們獨特地致力于為全世界的創作者賦能。 |
技術變革 我們致力于推動負責任地使用技術,造福社會。 |
|
![]() |
我們的價值觀 我們的公司價值觀——創造未來、擁有結果、提高標準和真誠——代表了我們是誰、我們如何在世界上出現,以及我們將如何定義我們未來的成功。 |
Adobe 和 AI
Adobe 正在利用人工智能作為副駕駛,使世界更具創造力、生產力和個性化,從而放大人類的聰明才智。