Adobe PDF 提取服務

Adobe PDF 提取服務

專用API
服務商 服務商: Adobe
【更新時間: 2024.08.13】 Adobe PDF 提取 API使用由 Adob??e Sensei 機器學習提供支持的 Web 服務解鎖任何 PDF 的結構和內容元素。
免費 (每月 500 份免費文檔交易) 去服務商官網采購>
瀏覽次數
35
采購人數
1
試用次數
1
! SLA: N/A
! 響應: N/A
! 適用于個人&企業
試用
收藏
×
完成
取消
×
書簽名稱
確定
<
產品介紹
>

什么是Adobe PDF 提取服務?

"Adobe PDF 提取服務"是一種基于 Adobe Sensei 機器學習技術的 Web 服務,旨在解鎖 PDF 文檔的結構和內容元素。該服務通過 Adobe PDF Extract API 提供,允許用戶從任何 PDF 文件中提取結構化數據,包括文本、表格、圖像等,并將這些數據以 JSON、CSV、XLSX 或 PNG 等格式輸出。這使得用戶能夠輕松地在各種下游系統中存儲、分析和操作這些數據。

什么是Adobe PDF 提取服務接口?

由服務使用方的應用程序發起,以Restful風格為主、通過公網HTTP協議調用Adobe PDF 提取服務,從而實現程序的自動化交互,提高服務效率。

Adobe PDF 提取服務有哪些核心功能?

全面的內容提取
提取結構化 JSON 文件中的所有 PDF 文檔元素,包括文本、表格和圖像,以支持各種下游解決方案。

 

文檔結構理解
對可能跨多列或多頁的文本對象(如標題、列表、腳注和段落)進行分類。捕獲所有對象的文本字體和樣式、定位和自然閱讀順序。
高度準確的結果
Adobe Sensei AI 技術可在多種文檔類型(原生 PDF 和掃描 PDF)中提供高度準確的數據提取,而無需自定義 ML 模板或模型訓練。

平臺無關
Adobe 的 PDF Extract API 是 RESTful,可用于與任何云平臺或內部部署應用程序無縫集成。

 

Adobe PDF 提取服務的核心優勢是什么?

  1. 全面的內容提取:Adobe PDF 提取服務能夠提取 PDF 文檔中的所有元素,包括文本、表格和圖像,并以結構化的 JSON 文件形式輸出。這種全面的內容提取能力支持各種下游解決方案,如數據分析、內容重新發布等。

  2. 文檔結構理解:借助 Adobe Sensei AI 技術,該服務能夠深入理解文檔結構,包括元素的識別、位置、相對于其他元素的連接以及自然閱讀順序。這使得提取的數據更加準確和有用。

  3. 高度準確的結果:Adobe Sensei AI 技術在多種文檔類型(原生 PDF 和掃描 PDF)中提供高度準確的數據提取,而無需用戶自定義 ML 模板或進行模型訓練。這大大降低了使用門檻,提高了工作效率。

  4. 平臺無關:Adobe PDF Extract API 是 RESTful 風格的,可以與任何云平臺或內部部署應用程序無縫集成。這種靈活性使得該服務能夠廣泛應用于各種場景和環境中。

  5. 安全性:Adobe 非常重視用戶數據的安全性,提供了全面的安全概述和保障措施,確保用戶在使用該服務時數據的安全性和隱私性。

  6. 易用性:用戶可以從免費套餐開始,每月獲得一定數量的免費文檔交易。此外,Adobe 還提供了可立即運行的示例代碼和交互式演示,幫助用戶快速上手并體驗 API 的強大功能。

在哪些場景會用到Adobe PDF 提取服務?

內容處理
快速準確地從原生和掃描的 PDF 中提取數據和上下文,以使用機器人流程自動化 (RPA) 和自然語言處理 (NLP) 等技術實現下游流程的自動化。

數據分析
從復雜的表中提取數據,包括單元格數據、列和行標題以及表屬性,以用于機器學習模型、分析或存儲。

 

內容重新發布
通過提取數據、結構上下文、文本和表格格式以及閱讀順序,以不同的媒體、語言和格式重新發布 PDF 文檔中的內容。
<
產品價格
>

<
使用指南
>

步驟 1:獲取訪問令牌

PDF 服務 API 端點是經過身份驗證的端點。獲取訪問令牌分為兩個步驟:

  1. 獲取憑據 調用 PDF 服務 API 需要 Adob??e 提供的憑據。要獲取憑據,請單擊此處并完成工作流程。請務必將憑據值復制并保存到安全位置。
  2. 檢索訪問令牌PDF 服務 API 需要 access_token 來授權請求??。使用 Postman Collection 中的“獲取 AccessToken”API 以及您的 client_id、client_secret(在 1 中下載的 pdfservices-api-credentials.json 文件中提到)來獲取 access_token,或者直接使用下面提到的 cURL 來獲取 access_token。

 

步驟 2:上傳資產

獲取訪問令牌后,我們需要上傳資產。上傳資產分為兩個步驟:

  1. 首先您需要使用以下 API 獲取上傳預簽名 URI。
  2. 從上述 API獲取響應狀態后,使用uploadUri上述 API 響應主體中的字段,通過 PUT API 調用將資產直接上傳到云提供商。您還將獲得一個assetID用于創建作業的字段。

 

步驟 3:創建作業

要為操作創建作業,請 assetID在 API 請求正文中使用步驟 2 中獲得的。成功提交作業后,您將獲得狀態代碼和將用于輪詢的響應標頭。

要創建作業,請參閱特定PDF 操作的相應 API 規范。

步驟 4:獲取狀態

成功創建作業后,您需要location使用以下 API 輪詢步驟 3 中返回的響應標頭

 

步驟 5:下載資產

從輪詢 API獲取響應代碼后,您將status在響應正文中收到一個字段,該字段可以是in progressdonefailed

如果status字段為in progress,則需要繼續輪詢位置,直到它變為donefailed

如果該status字段是done響應主體,則該字段中還會有一個下載預簽名 URI dowloadUri,它將用于通過以下 API 調用直接從云提供商下載資產

指南詳情鏈接:https://developer.adobe.com/document-services/docs/overview/pdf-accessibility-auto-tag-api/gettingstarted/

<
產品問答
>
?
如何查看我已經使用了多少次 API 交易或調用?
對于 Adob??e 企業條款許可協議 (ETLA) 客戶,您將每月收到有關使用情況的電子郵件。
?
我的公司已與 Adob??e 簽訂了企業協議。我可以將相同的 Adob??e 憑據用于 PDF Se...
您的 Adob??e Admin Console 管理員可能未配置您的企業 ID 以訪問 PDF 服務 API。如果您的組織當前是 Adob??e PDF 服務 API 的訂閱者,請聯系您的管理員。 如果您有興趣試用 Adob??e PDF Services API,請考慮使用與您的企業 ID 無關的 Adob??e ID(個人)。
?
為什么我必須使用個人帳戶時,設置一個免費層或帳戶?為什么我不能使用公司現有的企業電子郵件/帳戶?
只有在附加到企業定期許可協議(ETLA)并且組織的IT管理員已為該用戶提供訪問API的權限時,才能訪問Adobe AWS API或SDK。因此,如果您使用免費套餐,使用個人電子郵件可能比您現有的Adobe ID更容易、更快捷。
?
我在哪里可以找到我的客戶端 ID 或 API 密鑰?
您的客戶端 ID(也稱為 API 密鑰)是您的帳戶所獨有的,并在成功創建試用版的確認頁面上提供。這是后端代碼中用于進行免費套餐調用的“client_id”密鑰。
?
如果我已經擁有憑證并需要新的憑證,該如何獲取?
付費客戶和試用客戶均可通過訪問管理控制臺創建新憑據以及編輯現有憑據:https: //developer.adobe.com/console
?
當我支付 Adob??e Acrobat 服務費用時,我可以繼續使用相同的免費套餐憑證嗎?
您不應在免費套餐之外使用免費套餐憑證(憑證密鑰,又名 API 密鑰)。 當您啟動企業定期許可協議 (ETLA) 時,您將在 ETLA ORG 下收到并創建新的憑證——您將需要使用那些新的 ETLA 憑證來交換您的免費套餐憑證。
?
Adobe Acrobat 服務(PDF 服務 API 和 PDF 嵌入 API)是否符合 HIPA...
不是。客戶可以根據適用條款處理某些敏感個人信息。一般條款使用條款
<
關于我們
>
Adobe
企業
Adobe公司是一家全球領先的數字媒體和數字營銷解決方案提供商。通過其創新的產品和服務,Adobe不斷推動創意產業的發展。公司提供包括Adobe Creative Cloud、Adobe Experience Platform、Adobe Document Cloud等在內的多種API和服務平臺,助力開發者和企業創造令人難忘的數字體驗。Adobe還擁有一個活躍的技術社區,通過博客、GitHub、YouTube等渠道與開發者保持緊密聯系,共同探索技術前沿。
聯系信息
服務時間: 0:00 - 24:00
電話號碼: (408)536-3015
郵箱: accommodations@adobe.com
網頁在線客服: 咨詢

 

目標是我們的核心


了解我們如何努力為世界創造積極的變化。

 

面向所有人的 Adobe
我們致力于創造一個反映我們周圍世界多樣性的工作場所。

 

人人享有創造力
作為一家創意公司,我們獨特地致力于為全世界的創作者賦能。

技術變革
我們致力于推動負責任地使用技術,造福社會。

我們的價值觀
我們的公司價值觀——創造未來、擁有結果、提高標準和真誠——代表了我們是誰、我們如何在世界上出現,以及我們將如何定義我們未來的成功。

 


Adobe 和 AI
Adobe 正在利用人工智能作為副駕駛,使世界更具創造力、生產力和個性化,從而放大人類的聰明才智。

 

<
最可能同場景使用的其他API
>
API接口列表
<
產品價格
>

<
使用指南
>

步驟 1:獲取訪問令牌

PDF 服務 API 端點是經過身份驗證的端點。獲取訪問令牌分為兩個步驟:

  1. 獲取憑據 調用 PDF 服務 API 需要 Adob??e 提供的憑據。要獲取憑據,請單擊此處并完成工作流程。請務必將憑據值復制并保存到安全位置。
  2. 檢索訪問令牌PDF 服務 API 需要 access_token 來授權請求??。使用 Postman Collection 中的“獲取 AccessToken”API 以及您的 client_id、client_secret(在 1 中下載的 pdfservices-api-credentials.json 文件中提到)來獲取 access_token,或者直接使用下面提到的 cURL 來獲取 access_token。

 

步驟 2:上傳資產

獲取訪問令牌后,我們需要上傳資產。上傳資產分為兩個步驟:

  1. 首先您需要使用以下 API 獲取上傳預簽名 URI。
  2. 從上述 API獲取響應狀態后,使用uploadUri上述 API 響應主體中的字段,通過 PUT API 調用將資產直接上傳到云提供商。您還將獲得一個assetID用于創建作業的字段。

 

步驟 3:創建作業

要為操作創建作業,請 assetID在 API 請求正文中使用步驟 2 中獲得的。成功提交作業后,您將獲得狀態代碼和將用于輪詢的響應標頭。

要創建作業,請參閱特定PDF 操作的相應 API 規范。

步驟 4:獲取狀態

成功創建作業后,您需要location使用以下 API 輪詢步驟 3 中返回的響應標頭

 

步驟 5:下載資產

從輪詢 API獲取響應代碼后,您將status在響應正文中收到一個字段,該字段可以是in progressdonefailed

如果status字段為in progress,則需要繼續輪詢位置,直到它變為donefailed

如果該status字段是done響應主體,則該字段中還會有一個下載預簽名 URI dowloadUri,它將用于通過以下 API 調用直接從云提供商下載資產

指南詳情鏈接:https://developer.adobe.com/document-services/docs/overview/pdf-accessibility-auto-tag-api/gettingstarted/

<
依賴服務
>
<
產品問答
>
?
如何查看我已經使用了多少次 API 交易或調用?
對于 Adob??e 企業條款許可協議 (ETLA) 客戶,您將每月收到有關使用情況的電子郵件。
?
我的公司已與 Adob??e 簽訂了企業協議。我可以將相同的 Adob??e 憑據用于 PDF Se...
您的 Adob??e Admin Console 管理員可能未配置您的企業 ID 以訪問 PDF 服務 API。如果您的組織當前是 Adob??e PDF 服務 API 的訂閱者,請聯系您的管理員。 如果您有興趣試用 Adob??e PDF Services API,請考慮使用與您的企業 ID 無關的 Adob??e ID(個人)。
?
為什么我必須使用個人帳戶時,設置一個免費層或帳戶?為什么我不能使用公司現有的企業電子郵件/帳戶?
只有在附加到企業定期許可協議(ETLA)并且組織的IT管理員已為該用戶提供訪問API的權限時,才能訪問Adobe AWS API或SDK。因此,如果您使用免費套餐,使用個人電子郵件可能比您現有的Adobe ID更容易、更快捷。
?
我在哪里可以找到我的客戶端 ID 或 API 密鑰?
您的客戶端 ID(也稱為 API 密鑰)是您的帳戶所獨有的,并在成功創建試用版的確認頁面上提供。這是后端代碼中用于進行免費套餐調用的“client_id”密鑰。
?
如果我已經擁有憑證并需要新的憑證,該如何獲取?
付費客戶和試用客戶均可通過訪問管理控制臺創建新憑據以及編輯現有憑據:https: //developer.adobe.com/console
?
當我支付 Adob??e Acrobat 服務費用時,我可以繼續使用相同的免費套餐憑證嗎?
您不應在免費套餐之外使用免費套餐憑證(憑證密鑰,又名 API 密鑰)。 當您啟動企業定期許可協議 (ETLA) 時,您將在 ETLA ORG 下收到并創建新的憑證——您將需要使用那些新的 ETLA 憑證來交換您的免費套餐憑證。
?
Adobe Acrobat 服務(PDF 服務 API 和 PDF 嵌入 API)是否符合 HIPA...
不是。客戶可以根據適用條款處理某些敏感個人信息。一般條款使用條款
<
關于我們
>
Adobe
企業
Adobe公司是一家全球領先的數字媒體和數字營銷解決方案提供商。通過其創新的產品和服務,Adobe不斷推動創意產業的發展。公司提供包括Adobe Creative Cloud、Adobe Experience Platform、Adobe Document Cloud等在內的多種API和服務平臺,助力開發者和企業創造令人難忘的數字體驗。Adobe還擁有一個活躍的技術社區,通過博客、GitHub、YouTube等渠道與開發者保持緊密聯系,共同探索技術前沿。
聯系信息
服務時間: 0:00 - 24:00
電話號碼: (408)536-3015
郵箱: accommodations@adobe.com
網頁在線客服: 咨詢

 

目標是我們的核心


了解我們如何努力為世界創造積極的變化。

 

面向所有人的 Adobe
我們致力于創造一個反映我們周圍世界多樣性的工作場所。

 

人人享有創造力
作為一家創意公司,我們獨特地致力于為全世界的創作者賦能。

技術變革
我們致力于推動負責任地使用技術,造福社會。

我們的價值觀
我們的公司價值觀——創造未來、擁有結果、提高標準和真誠——代表了我們是誰、我們如何在世界上出現,以及我們將如何定義我們未來的成功。

 


Adobe 和 AI
Adobe 正在利用人工智能作為副駕駛,使世界更具創造力、生產力和個性化,從而放大人類的聰明才智。

 

<
最可能同場景使用的其他API
>