Adobe PDF 提取服務(wù)

Adobe PDF 提取服務(wù)

專用API
服務(wù)商 服務(wù)商: Adobe
【更新時間: 2024.08.13】 Adobe PDF 提取 API使用由 Adob??e Sensei 機(jī)器學(xué)習(xí)提供支持的 Web 服務(wù)解鎖任何 PDF 的結(jié)構(gòu)和內(nèi)容元素。
免費(fèi) (每月 500 份免費(fèi)文檔交易) 去服務(wù)商官網(wǎng)采購>
瀏覽次數(shù)
35
采購人數(shù)
1
試用次數(shù)
1
! SLA: N/A
! 響應(yīng): N/A
! 適用于個人&企業(yè)
試用
收藏
×
完成
取消
×
書簽名稱
確定
<
產(chǎn)品介紹
>

什么是Adobe PDF 提取服務(wù)?

"Adobe PDF 提取服務(wù)"是一種基于 Adobe Sensei 機(jī)器學(xué)習(xí)技術(shù)的 Web 服務(wù),旨在解鎖 PDF 文檔的結(jié)構(gòu)和內(nèi)容元素。該服務(wù)通過 Adobe PDF Extract API 提供,允許用戶從任何 PDF 文件中提取結(jié)構(gòu)化數(shù)據(jù),包括文本、表格、圖像等,并將這些數(shù)據(jù)以 JSON、CSV、XLSX 或 PNG 等格式輸出。這使得用戶能夠輕松地在各種下游系統(tǒng)中存儲、分析和操作這些數(shù)據(jù)。

什么是Adobe PDF 提取服務(wù)接口?

由服務(wù)使用方的應(yīng)用程序發(fā)起,以Restful風(fēng)格為主、通過公網(wǎng)HTTP協(xié)議調(diào)用Adobe PDF 提取服務(wù),從而實現(xiàn)程序的自動化交互,提高服務(wù)效率。

Adobe PDF 提取服務(wù)有哪些核心功能?

全面的內(nèi)容提取
提取結(jié)構(gòu)化 JSON 文件中的所有 PDF 文檔元素,包括文本、表格和圖像,以支持各種下游解決方案。

 

文檔結(jié)構(gòu)理解
對可能跨多列或多頁的文本對象(如標(biāo)題、列表、腳注和段落)進(jìn)行分類。捕獲所有對象的文本字體和樣式、定位和自然閱讀順序。
高度準(zhǔn)確的結(jié)果
Adobe Sensei AI 技術(shù)可在多種文檔類型(原生 PDF 和掃描 PDF)中提供高度準(zhǔn)確的數(shù)據(jù)提取,而無需自定義 ML 模板或模型訓(xùn)練。

平臺無關(guān)
Adobe 的 PDF Extract API 是 RESTful,可用于與任何云平臺或內(nèi)部部署應(yīng)用程序無縫集成。

 

Adobe PDF 提取服務(wù)的核心優(yōu)勢是什么?

  1. 全面的內(nèi)容提取:Adobe PDF 提取服務(wù)能夠提取 PDF 文檔中的所有元素,包括文本、表格和圖像,并以結(jié)構(gòu)化的 JSON 文件形式輸出。這種全面的內(nèi)容提取能力支持各種下游解決方案,如數(shù)據(jù)分析、內(nèi)容重新發(fā)布等。

  2. 文檔結(jié)構(gòu)理解:借助 Adobe Sensei AI 技術(shù),該服務(wù)能夠深入理解文檔結(jié)構(gòu),包括元素的識別、位置、相對于其他元素的連接以及自然閱讀順序。這使得提取的數(shù)據(jù)更加準(zhǔn)確和有用。

  3. 高度準(zhǔn)確的結(jié)果:Adobe Sensei AI 技術(shù)在多種文檔類型(原生 PDF 和掃描 PDF)中提供高度準(zhǔn)確的數(shù)據(jù)提取,而無需用戶自定義 ML 模板或進(jìn)行模型訓(xùn)練。這大大降低了使用門檻,提高了工作效率。

  4. 平臺無關(guān):Adobe PDF Extract API 是 RESTful 風(fēng)格的,可以與任何云平臺或內(nèi)部部署應(yīng)用程序無縫集成。這種靈活性使得該服務(wù)能夠廣泛應(yīng)用于各種場景和環(huán)境中。

  5. 安全性:Adobe 非常重視用戶數(shù)據(jù)的安全性,提供了全面的安全概述和保障措施,確保用戶在使用該服務(wù)時數(shù)據(jù)的安全性和隱私性。

  6. 易用性:用戶可以從免費(fèi)套餐開始,每月獲得一定數(shù)量的免費(fèi)文檔交易。此外,Adobe 還提供了可立即運(yùn)行的示例代碼和交互式演示,幫助用戶快速上手并體驗 API 的強(qiáng)大功能。

在哪些場景會用到Adobe PDF 提取服務(wù)?

內(nèi)容處理
快速準(zhǔn)確地從原生和掃描的 PDF 中提取數(shù)據(jù)和上下文,以使用機(jī)器人流程自動化 (RPA) 和自然語言處理 (NLP) 等技術(shù)實現(xiàn)下游流程的自動化。

數(shù)據(jù)分析
從復(fù)雜的表中提取數(shù)據(jù),包括單元格數(shù)據(jù)、列和行標(biāo)題以及表屬性,以用于機(jī)器學(xué)習(xí)模型、分析或存儲。

 

內(nèi)容重新發(fā)布
通過提取數(shù)據(jù)、結(jié)構(gòu)上下文、文本和表格格式以及閱讀順序,以不同的媒體、語言和格式重新發(fā)布 PDF 文檔中的內(nèi)容。
<
產(chǎn)品價格
>

<
使用指南
>

步驟 1:獲取訪問令牌

PDF 服務(wù) API 端點是經(jīng)過身份驗證的端點。獲取訪問令牌分為兩個步驟:

  1. 獲取憑據(jù) 調(diào)用 PDF 服務(wù) API 需要 Adob??e 提供的憑據(jù)。要獲取憑據(jù),請單擊此處并完成工作流程。請務(wù)必將憑據(jù)值復(fù)制并保存到安全位置。
  2. 檢索訪問令牌PDF 服務(wù) API 需要 access_token 來授權(quán)請求??。使用 Postman Collection 中的“獲取 AccessToken”API 以及您的 client_id、client_secret(在 1 中下載的 pdfservices-api-credentials.json 文件中提到)來獲取 access_token,或者直接使用下面提到的 cURL 來獲取 access_token。

 

步驟 2:上傳資產(chǎn)

獲取訪問令牌后,我們需要上傳資產(chǎn)。上傳資產(chǎn)分為兩個步驟:

  1. 首先您需要使用以下 API 獲取上傳預(yù)簽名 URI。
  2. 從上述 API獲取響應(yīng)狀態(tài)后,使用uploadUri上述 API 響應(yīng)主體中的字段,通過 PUT API 調(diào)用將資產(chǎn)直接上傳到云提供商。您還將獲得一個assetID用于創(chuàng)建作業(yè)的字段。

 

步驟 3:創(chuàng)建作業(yè)

要為操作創(chuàng)建作業(yè),請 assetID在 API 請求正文中使用步驟 2 中獲得的。成功提交作業(yè)后,您將獲得狀態(tài)代碼和將用于輪詢的響應(yīng)標(biāo)頭。

要創(chuàng)建作業(yè),請參閱特定PDF 操作的相應(yīng) API 規(guī)范。

步驟 4:獲取狀態(tài)

成功創(chuàng)建作業(yè)后,您需要location使用以下 API 輪詢步驟 3 中返回的響應(yīng)標(biāo)頭

 

步驟 5:下載資產(chǎn)

從輪詢 API獲取響應(yīng)代碼后,您將status在響應(yīng)正文中收到一個字段,該字段可以是in progressdonefailed

如果status字段為in progress,則需要繼續(xù)輪詢位置,直到它變?yōu)?/span>donefailed

如果該status字段是done響應(yīng)主體,則該字段中還會有一個下載預(yù)簽名 URI dowloadUri,它將用于通過以下 API 調(diào)用直接從云提供商下載資產(chǎn)

指南詳情鏈接:https://developer.adobe.com/document-services/docs/overview/pdf-accessibility-auto-tag-api/gettingstarted/

<
產(chǎn)品問答
>
?
如何查看我已經(jīng)使用了多少次 API 交易或調(diào)用?
對于 Adob??e 企業(yè)條款許可協(xié)議 (ETLA) 客戶,您將每月收到有關(guān)使用情況的電子郵件。
?
我的公司已與 Adob??e 簽訂了企業(yè)協(xié)議。我可以將相同的 Adob??e 憑據(jù)用于 PDF Se...
您的 Adob??e Admin Console 管理員可能未配置您的企業(yè) ID 以訪問 PDF 服務(wù) API。如果您的組織當(dāng)前是 Adob??e PDF 服務(wù) API 的訂閱者,請聯(lián)系您的管理員。 如果您有興趣試用 Adob??e PDF Services API,請考慮使用與您的企業(yè) ID 無關(guān)的 Adob??e ID(個人)。
?
為什么我必須使用個人帳戶時,設(shè)置一個免費(fèi)層或帳戶?為什么我不能使用公司現(xiàn)有的企業(yè)電子郵件/帳戶?
只有在附加到企業(yè)定期許可協(xié)議(ETLA)并且組織的IT管理員已為該用戶提供訪問API的權(quán)限時,才能訪問Adobe AWS API或SDK。因此,如果您使用免費(fèi)套餐,使用個人電子郵件可能比您現(xiàn)有的Adobe ID更容易、更快捷。
?
我在哪里可以找到我的客戶端 ID 或 API 密鑰?
您的客戶端 ID(也稱為 API 密鑰)是您的帳戶所獨(dú)有的,并在成功創(chuàng)建試用版的確認(rèn)頁面上提供。這是后端代碼中用于進(jìn)行免費(fèi)套餐調(diào)用的“client_id”密鑰。
?
如果我已經(jīng)擁有憑證并需要新的憑證,該如何獲取?
付費(fèi)客戶和試用客戶均可通過訪問管理控制臺創(chuàng)建新憑據(jù)以及編輯現(xiàn)有憑據(jù):https: //developer.adobe.com/console
?
當(dāng)我支付 Adob??e Acrobat 服務(wù)費(fèi)用時,我可以繼續(xù)使用相同的免費(fèi)套餐憑證嗎?
您不應(yīng)在免費(fèi)套餐之外使用免費(fèi)套餐憑證(憑證密鑰,又名 API 密鑰)。 當(dāng)您啟動企業(yè)定期許可協(xié)議 (ETLA) 時,您將在 ETLA ORG 下收到并創(chuàng)建新的憑證——您將需要使用那些新的 ETLA 憑證來交換您的免費(fèi)套餐憑證。
?
Adobe Acrobat 服務(wù)(PDF 服務(wù) API 和 PDF 嵌入 API)是否符合 HIPA...
不是。客戶可以根據(jù)適用條款處理某些敏感個人信息。一般條款使用條款
<
關(guān)于我們
>
Adobe
企業(yè)
Adobe公司是一家全球領(lǐng)先的數(shù)字媒體和數(shù)字營銷解決方案提供商。通過其創(chuàng)新的產(chǎn)品和服務(wù),Adobe不斷推動創(chuàng)意產(chǎn)業(yè)的發(fā)展。公司提供包括Adobe Creative Cloud、Adobe Experience Platform、Adobe Document Cloud等在內(nèi)的多種API和服務(wù)平臺,助力開發(fā)者和企業(yè)創(chuàng)造令人難忘的數(shù)字體驗。Adobe還擁有一個活躍的技術(shù)社區(qū),通過博客、GitHub、YouTube等渠道與開發(fā)者保持緊密聯(lián)系,共同探索技術(shù)前沿。
聯(lián)系信息
服務(wù)時間: 0:00 - 24:00
電話號碼: (408)536-3015
郵箱: accommodations@adobe.com
網(wǎng)頁在線客服: 咨詢

 

目標(biāo)是我們的核心


了解我們?nèi)绾闻槭澜鐒?chuàng)造積極的變化。

 

面向所有人的 Adobe
我們致力于創(chuàng)造一個反映我們周圍世界多樣性的工作場所。

 

人人享有創(chuàng)造力
作為一家創(chuàng)意公司,我們獨(dú)特地致力于為全世界的創(chuàng)作者賦能。

技術(shù)變革
我們致力于推動負(fù)責(zé)任地使用技術(shù),造福社會。

我們的價值觀
我們的公司價值觀——創(chuàng)造未來、擁有結(jié)果、提高標(biāo)準(zhǔn)和真誠——代表了我們是誰、我們?nèi)绾卧谑澜缟铣霈F(xiàn),以及我們將如何定義我們未來的成功。

 


Adobe 和 AI
Adobe 正在利用人工智能作為副駕駛,使世界更具創(chuàng)造力、生產(chǎn)力和個性化,從而放大人類的聰明才智。

 

<
最可能同場景使用的其他API
>
API接口列表
<
產(chǎn)品價格
>

<
使用指南
>

步驟 1:獲取訪問令牌

PDF 服務(wù) API 端點是經(jīng)過身份驗證的端點。獲取訪問令牌分為兩個步驟:

  1. 獲取憑據(jù) 調(diào)用 PDF 服務(wù) API 需要 Adob??e 提供的憑據(jù)。要獲取憑據(jù),請單擊此處并完成工作流程。請務(wù)必將憑據(jù)值復(fù)制并保存到安全位置。
  2. 檢索訪問令牌PDF 服務(wù) API 需要 access_token 來授權(quán)請求??。使用 Postman Collection 中的“獲取 AccessToken”API 以及您的 client_id、client_secret(在 1 中下載的 pdfservices-api-credentials.json 文件中提到)來獲取 access_token,或者直接使用下面提到的 cURL 來獲取 access_token。

 

步驟 2:上傳資產(chǎn)

獲取訪問令牌后,我們需要上傳資產(chǎn)。上傳資產(chǎn)分為兩個步驟:

  1. 首先您需要使用以下 API 獲取上傳預(yù)簽名 URI。
  2. 從上述 API獲取響應(yīng)狀態(tài)后,使用uploadUri上述 API 響應(yīng)主體中的字段,通過 PUT API 調(diào)用將資產(chǎn)直接上傳到云提供商。您還將獲得一個assetID用于創(chuàng)建作業(yè)的字段。

 

步驟 3:創(chuàng)建作業(yè)

要為操作創(chuàng)建作業(yè),請 assetID在 API 請求正文中使用步驟 2 中獲得的。成功提交作業(yè)后,您將獲得狀態(tài)代碼和將用于輪詢的響應(yīng)標(biāo)頭。

要創(chuàng)建作業(yè),請參閱特定PDF 操作的相應(yīng) API 規(guī)范。

步驟 4:獲取狀態(tài)

成功創(chuàng)建作業(yè)后,您需要location使用以下 API 輪詢步驟 3 中返回的響應(yīng)標(biāo)頭

 

步驟 5:下載資產(chǎn)

從輪詢 API獲取響應(yīng)代碼后,您將status在響應(yīng)正文中收到一個字段,該字段可以是in progressdonefailed

如果status字段為in progress,則需要繼續(xù)輪詢位置,直到它變?yōu)?/span>donefailed

如果該status字段是done響應(yīng)主體,則該字段中還會有一個下載預(yù)簽名 URI dowloadUri,它將用于通過以下 API 調(diào)用直接從云提供商下載資產(chǎn)

指南詳情鏈接:https://developer.adobe.com/document-services/docs/overview/pdf-accessibility-auto-tag-api/gettingstarted/

<
依賴服務(wù)
>
<
產(chǎn)品問答
>
?
如何查看我已經(jīng)使用了多少次 API 交易或調(diào)用?
對于 Adob??e 企業(yè)條款許可協(xié)議 (ETLA) 客戶,您將每月收到有關(guān)使用情況的電子郵件。
?
我的公司已與 Adob??e 簽訂了企業(yè)協(xié)議。我可以將相同的 Adob??e 憑據(jù)用于 PDF Se...
您的 Adob??e Admin Console 管理員可能未配置您的企業(yè) ID 以訪問 PDF 服務(wù) API。如果您的組織當(dāng)前是 Adob??e PDF 服務(wù) API 的訂閱者,請聯(lián)系您的管理員。 如果您有興趣試用 Adob??e PDF Services API,請考慮使用與您的企業(yè) ID 無關(guān)的 Adob??e ID(個人)。
?
為什么我必須使用個人帳戶時,設(shè)置一個免費(fèi)層或帳戶?為什么我不能使用公司現(xiàn)有的企業(yè)電子郵件/帳戶?
只有在附加到企業(yè)定期許可協(xié)議(ETLA)并且組織的IT管理員已為該用戶提供訪問API的權(quán)限時,才能訪問Adobe AWS API或SDK。因此,如果您使用免費(fèi)套餐,使用個人電子郵件可能比您現(xiàn)有的Adobe ID更容易、更快捷。
?
我在哪里可以找到我的客戶端 ID 或 API 密鑰?
您的客戶端 ID(也稱為 API 密鑰)是您的帳戶所獨(dú)有的,并在成功創(chuàng)建試用版的確認(rèn)頁面上提供。這是后端代碼中用于進(jìn)行免費(fèi)套餐調(diào)用的“client_id”密鑰。
?
如果我已經(jīng)擁有憑證并需要新的憑證,該如何獲取?
付費(fèi)客戶和試用客戶均可通過訪問管理控制臺創(chuàng)建新憑據(jù)以及編輯現(xiàn)有憑據(jù):https: //developer.adobe.com/console
?
當(dāng)我支付 Adob??e Acrobat 服務(wù)費(fèi)用時,我可以繼續(xù)使用相同的免費(fèi)套餐憑證嗎?
您不應(yīng)在免費(fèi)套餐之外使用免費(fèi)套餐憑證(憑證密鑰,又名 API 密鑰)。 當(dāng)您啟動企業(yè)定期許可協(xié)議 (ETLA) 時,您將在 ETLA ORG 下收到并創(chuàng)建新的憑證——您將需要使用那些新的 ETLA 憑證來交換您的免費(fèi)套餐憑證。
?
Adobe Acrobat 服務(wù)(PDF 服務(wù) API 和 PDF 嵌入 API)是否符合 HIPA...
不是。客戶可以根據(jù)適用條款處理某些敏感個人信息。一般條款使用條款
<
關(guān)于我們
>
Adobe
企業(yè)
Adobe公司是一家全球領(lǐng)先的數(shù)字媒體和數(shù)字營銷解決方案提供商。通過其創(chuàng)新的產(chǎn)品和服務(wù),Adobe不斷推動創(chuàng)意產(chǎn)業(yè)的發(fā)展。公司提供包括Adobe Creative Cloud、Adobe Experience Platform、Adobe Document Cloud等在內(nèi)的多種API和服務(wù)平臺,助力開發(fā)者和企業(yè)創(chuàng)造令人難忘的數(shù)字體驗。Adobe還擁有一個活躍的技術(shù)社區(qū),通過博客、GitHub、YouTube等渠道與開發(fā)者保持緊密聯(lián)系,共同探索技術(shù)前沿。
聯(lián)系信息
服務(wù)時間: 0:00 - 24:00
電話號碼: (408)536-3015
郵箱: accommodations@adobe.com
網(wǎng)頁在線客服: 咨詢

 

目標(biāo)是我們的核心


了解我們?nèi)绾闻槭澜鐒?chuàng)造積極的變化。

 

面向所有人的 Adobe
我們致力于創(chuàng)造一個反映我們周圍世界多樣性的工作場所。

 

人人享有創(chuàng)造力
作為一家創(chuàng)意公司,我們獨(dú)特地致力于為全世界的創(chuàng)作者賦能。

技術(shù)變革
我們致力于推動負(fù)責(zé)任地使用技術(shù),造福社會。

我們的價值觀
我們的公司價值觀——創(chuàng)造未來、擁有結(jié)果、提高標(biāo)準(zhǔn)和真誠——代表了我們是誰、我們?nèi)绾卧谑澜缟铣霈F(xiàn),以及我們將如何定義我們未來的成功。

 


Adobe 和 AI
Adobe 正在利用人工智能作為副駕駛,使世界更具創(chuàng)造力、生產(chǎn)力和個性化,從而放大人類的聰明才智。

 

<
最可能同場景使用的其他API
>