Amazon 語音轉文本-Transcribe

Amazon 語音轉文本-Transcribe

專用API
【更新時間: 2024.06.18】 Amazon Transcribe 使用一種稱為自動語音識別 (ASR) 的深度學習過程,快速準確地將語音轉換為文本。
瀏覽次數
71
采購人數
3
試用次數
0
! SLA: N/A
! 響應: N/A
! 適用于個人&企業
試用
收藏
×
完成
取消
×
書簽名稱
確定
<
產品介紹
>

什么是Transcribe的Amazon 語音轉文本?

"Amazon 語音轉文本-Transcribe"是Amazon提供的一項基于云端的自動語音識別(ASR)服務,它可以將音頻和視頻文件中的語音內容轉換為高質量的文本轉錄。Transcribe支持多種語言,包括英語、西班牙語、中文、法語、德語等,旨在幫助用戶輕松地將音頻內容轉換為易于閱讀、編輯和搜索的文本格式。

什么是Transcribe的Amazon 語音轉文本接口?

由服務使用方的應用程序發起,以Restful風格為主、通過公網HTTP協議調用Transcribe的Amazon 語音轉文本,從而實現程序的自動化交互,提高服務效率。

Transcribe的Amazon 語音轉文本有哪些核心功能?

1. 從客戶通話、視頻文件、臨床對話等資源中提取關鍵業務見解。

2. 借助完全托管和持續訓練的最先進語音識別模型改善業務成果。

3. 使用理解所在領域特定詞匯的自定義模型提高準確性。

4. 通過掩蓋敏感信息確保客戶隱私和安全性。

Transcribe的Amazon 語音轉文本的核心優勢是什么?

  1. 高精度:使用先進的機器學習技術,能夠生成高質量、高準確率的轉錄文本。

  2. 靈活性:支持多種音頻格式和多種語言,適應不同場景和需求。

  3. 可擴展性:基于云端的架構,能夠輕松處理大規模音頻數據,滿足企業級需求。

  4. 可定制性:允許用戶根據需求自定義詞匯表和語言模型,提高轉錄的準確性和特定領域的適用性。

  5. 安全性:提供多種安全功能,如數據加密、訪問控制等,確保用戶數據的安全和隱私。

在哪些場景會用到Transcribe的Amazon 語音轉文本?

  1. 媒體和娛樂:用于電影、電視節目、播客等媒體內容的字幕制作和搜索。

  2. 教育:用于在線課程和講座的轉錄,方便學生復習和搜索。

  3. 法律:用于法庭審判、律師咨詢等場景的音頻記錄轉錄,便于查閱和引用。

  4. 企業會議:用于公司內部會議和研討會的音頻記錄轉錄,方便整理和分享會議內容。

<
產品價格
>
按實際使用量付費模式

您按月付費,計費依據是您處理的文本的字符數量。Amazon Polly 的標準語音定價為:對于超出免費套餐的語音或語音標記請求,每 100 萬個字符 4.00 USD。Amazon Polly 的神經語音定價為:對于超出免費套餐的語音或請求的語音標記,每 100 萬個字符 16.00 USD。Amazon Polly 的長格式語音定價為:對于超出免費套餐的語音或請求的語音標記,每 100 萬個字符 100.00 USD。 Amazon Polly 的生成式語音定價為:對于超出免費套餐的語音請求,每 100 萬個字符 30 USD。

每月數百萬個字符

對于 Amazon Polly 的標準語音,從您提交第一個 Polly 語音或語音標記請求起 12 個月內,針對該類請求,免費套餐每個月提供 500 萬個字符服務。對于神經語音,從您提交第一個語音或語音標記請求起 12 個月內,針對該類請求,免費套餐每個月提供 100 萬個字符服務。對于長格式語音,從您提交第一個 Polly 語音或語音標記請求起 12 個月內,針對該類請求,免費套餐每個月提供 50 萬個字符服務。 對于生成式語音,從您提交第一個 Polly 語音請求起 12 個月內,針對該類請求,免費套餐每個月提供 10 萬字符的服務。

<
使用指南
>
Step 1 - Sign up for an Amazon Web Services account
設置并登錄您的 AWS 賬戶 觀看網絡研討會并閱讀文檔 登錄 Polly 控制臺并開始構建。
<
產品問答
>
?
什么是 Amazon Transcribe?
Amazon Transcribe 是一項 AWS 人工智能(AI)服務,使您能夠輕松實現語音轉文本功能。采用自動語音識別(ASR)技術,您可以將 Amazon Transcribe 用于各種業務應用程序,包括轉錄基于語音的客戶服務通話、生成音頻/視頻內容字幕,以及對音頻/視頻內容執行(基于文本的)內容分析。
?
Amazon Transcribe 如何與其他 AWS 產品交互?
Amazon Transcribe 可以將音頻輸入轉換為文本,這為開發基于語音輸入的各種文本分析應用程序打開了方便之門。例如,通過將 Amazon Comprehend 用于來自 Amazon Transcribe 的轉換后文本數據,您可以進行情緒分析或提取實體和關鍵短語。同樣,通過將 Amazon Translate 與 Amazon Poly 集成,您可以接收一種語言的語音輸入,然后將其翻譯為另一種語言并生成語音輸出,從而有效地實現多種語言對話。還可以將 AmazonTranscribe與 Amazon Kendra 或AmazonOpenSearch 集成,以便在音頻/視頻庫內編寫索引并執行基于文本的搜索。要了解更多信息,請查看實時呼叫分析和座席協助、呼叫后分析、媒體搜索或內容分析解決方案。
?
我在使用 Amazon Transcribe 之前還應了解什么?
Amazon Transcribe 旨在處理各種語音和聲學特征,包括音量、音調和語速的變化。音頻信號的質量和內容(包括但不限于背景噪音、揚聲器重疊、口音或一個音頻文件內語言間的切換等因素)可能會影響服務輸出的準確性。我們在不斷更新服務,以改進其適應其他聲音變化和內容類型的能力, 使用 Amazon Transcribe
<
關于我們
>
亞馬遜云科技(Amazon Web Services,簡稱AWS)是全球領先的云計算服務提供商,提供包括計算、存儲、數據庫、分析、機器學習、物聯網、移動、安全、混合云、虛擬和增強現實等在內的廣泛服務。AWS在全球34個地理區域內運營108個可用區,服務超過200個國家和地區,幫助企業、開發者和政府機構構建靈活、可靠、可擴展的云基礎設施。作為亞馬遜公司的一部分,AWS致力于提供創新的云解決方案,支持客戶實現數字化轉型。
聯系信息
服務時間: 早9:00-晚8:00 (法定假期除外)
電話號碼: +86 (10) 1010 0866
網頁在線客服: 咨詢

AWS 云計算

Amazon Web Services(AWS)是全球最全面、應用最廣泛的云,從全球數據中心提供超過 200 項功能齊全的服務。數百萬客戶(包括增長最快速的初創公司、最大型企業和主要的政府機構)都在使用 AWS 來降低成本、提高敏捷性并加速創新。

 

最多的功能
從計算、存儲和數據庫等基礎設施技術,到機器學習、人工智能、數據湖和分析以及物聯網等新興技術,AWS 提供的服務以及其中的功能比其他任何云服務提供商的都要多得多。這使得將現有應用程序遷移到云中并構建您可以想象的幾乎任何東西都變得更快、更容易且更具成本效益。

AWS 的這些服務還具有最為多樣復雜的功能。例如,AWS 提供了種類繁多的數據庫,這些數據庫是為不同類型的應用程序專門構建的,因此您可以選擇適合作業的工具來獲得最佳的成本和性能。

 

最大的客戶和合作伙伴社區
AWS 擁有最大且最具活力的社區,在全球擁有數百萬活躍客戶和成千上萬個合作伙伴。幾乎所有行業和規模的客戶(包括初創公司、企業和公共部門組織)都在 AWS 上運行所有可能的使用案例。AWS 合作伙伴網絡 (APN) 包括專注于 AWS 服務的數千個系統集成商和成千上萬個將其技術應用到 AWS 中的獨立軟件供應商 (ISV)。

 

最安全
AWS 旨在成為當今市場上最靈活、最安全的云計算環境。我們的核心基礎設施是為了滿足軍事、全球的銀行和其他高度敏感性組織的安全要求而構建。一組深度云安全工具對此提供支持,其中包括超過 300 項安全、合規性和監管服務及功能,以及對 143 項安全標準和合規性認證的支持。

 

最快的創新速度
借助 AWS,您可以利用最新技術更快地進行實驗和創新。我們將不斷加快創新步伐,以發明您可用于轉變業務的全新技術。例如,在 2014 年,AWS 通過推出 AWS Lambda 在無服務器計算領域開創了先河,該平臺使開發人員無需預置或管理服務器即可運行其代碼。AWS 構建了 Amazon SageMaker,這是一種完全托管的機器學習服務,可讓日常開發人員和科學家無需任何前置經驗即可運用機器學習。

 

最成熟的運營專業能力
AWS 具有無與倫比的經驗、成熟度、可靠性、安全性和性能,您可以將其用于最重要的應用程序。在超過 17 年的時間中,AWS 一直在為運行各種使用案例的全球數百萬客戶提供云服務。在所有云服務提供商中,AWS 擁有最豐富的大規模運營經驗。

 

AWS 區域的全球網絡
AWS 擁有覆蓋范圍領先的全球云基礎設施。Gartner 已將 AWS 區域/可用區模型
視為一種值得推薦運行方式,適用于要求高可用性的企業應用程序。

<
最可能同場景使用的其他API
>
API接口列表
<
產品價格
>
按實際使用量付費模式

您按月付費,計費依據是您處理的文本的字符數量。Amazon Polly 的標準語音定價為:對于超出免費套餐的語音或語音標記請求,每 100 萬個字符 4.00 USD。Amazon Polly 的神經語音定價為:對于超出免費套餐的語音或請求的語音標記,每 100 萬個字符 16.00 USD。Amazon Polly 的長格式語音定價為:對于超出免費套餐的語音或請求的語音標記,每 100 萬個字符 100.00 USD。 Amazon Polly 的生成式語音定價為:對于超出免費套餐的語音請求,每 100 萬個字符 30 USD。

每月數百萬個字符

對于 Amazon Polly 的標準語音,從您提交第一個 Polly 語音或語音標記請求起 12 個月內,針對該類請求,免費套餐每個月提供 500 萬個字符服務。對于神經語音,從您提交第一個語音或語音標記請求起 12 個月內,針對該類請求,免費套餐每個月提供 100 萬個字符服務。對于長格式語音,從您提交第一個 Polly 語音或語音標記請求起 12 個月內,針對該類請求,免費套餐每個月提供 50 萬個字符服務。 對于生成式語音,從您提交第一個 Polly 語音請求起 12 個月內,針對該類請求,免費套餐每個月提供 10 萬字符的服務。

<
使用指南
>
Step 1 - Sign up for an Amazon Web Services account
設置并登錄您的 AWS 賬戶 觀看網絡研討會并閱讀文檔 登錄 Polly 控制臺并開始構建。
<
依賴服務
>
<
產品問答
>
?
什么是 Amazon Transcribe?
Amazon Transcribe 是一項 AWS 人工智能(AI)服務,使您能夠輕松實現語音轉文本功能。采用自動語音識別(ASR)技術,您可以將 Amazon Transcribe 用于各種業務應用程序,包括轉錄基于語音的客戶服務通話、生成音頻/視頻內容字幕,以及對音頻/視頻內容執行(基于文本的)內容分析。
?
Amazon Transcribe 如何與其他 AWS 產品交互?
Amazon Transcribe 可以將音頻輸入轉換為文本,這為開發基于語音輸入的各種文本分析應用程序打開了方便之門。例如,通過將 Amazon Comprehend 用于來自 Amazon Transcribe 的轉換后文本數據,您可以進行情緒分析或提取實體和關鍵短語。同樣,通過將 Amazon Translate 與 Amazon Poly 集成,您可以接收一種語言的語音輸入,然后將其翻譯為另一種語言并生成語音輸出,從而有效地實現多種語言對話。還可以將 AmazonTranscribe與 Amazon Kendra 或AmazonOpenSearch 集成,以便在音頻/視頻庫內編寫索引并執行基于文本的搜索。要了解更多信息,請查看實時呼叫分析和座席協助、呼叫后分析、媒體搜索或內容分析解決方案。
?
我在使用 Amazon Transcribe 之前還應了解什么?
Amazon Transcribe 旨在處理各種語音和聲學特征,包括音量、音調和語速的變化。音頻信號的質量和內容(包括但不限于背景噪音、揚聲器重疊、口音或一個音頻文件內語言間的切換等因素)可能會影響服務輸出的準確性。我們在不斷更新服務,以改進其適應其他聲音變化和內容類型的能力, 使用 Amazon Transcribe
<
關于我們
>
亞馬遜云科技(Amazon Web Services,簡稱AWS)是全球領先的云計算服務提供商,提供包括計算、存儲、數據庫、分析、機器學習、物聯網、移動、安全、混合云、虛擬和增強現實等在內的廣泛服務。AWS在全球34個地理區域內運營108個可用區,服務超過200個國家和地區,幫助企業、開發者和政府機構構建靈活、可靠、可擴展的云基礎設施。作為亞馬遜公司的一部分,AWS致力于提供創新的云解決方案,支持客戶實現數字化轉型。
聯系信息
服務時間: 早9:00-晚8:00 (法定假期除外)
電話號碼: +86 (10) 1010 0866
網頁在線客服: 咨詢

AWS 云計算

Amazon Web Services(AWS)是全球最全面、應用最廣泛的云,從全球數據中心提供超過 200 項功能齊全的服務。數百萬客戶(包括增長最快速的初創公司、最大型企業和主要的政府機構)都在使用 AWS 來降低成本、提高敏捷性并加速創新。

 

最多的功能
從計算、存儲和數據庫等基礎設施技術,到機器學習、人工智能、數據湖和分析以及物聯網等新興技術,AWS 提供的服務以及其中的功能比其他任何云服務提供商的都要多得多。這使得將現有應用程序遷移到云中并構建您可以想象的幾乎任何東西都變得更快、更容易且更具成本效益。

AWS 的這些服務還具有最為多樣復雜的功能。例如,AWS 提供了種類繁多的數據庫,這些數據庫是為不同類型的應用程序專門構建的,因此您可以選擇適合作業的工具來獲得最佳的成本和性能。

 

最大的客戶和合作伙伴社區
AWS 擁有最大且最具活力的社區,在全球擁有數百萬活躍客戶和成千上萬個合作伙伴。幾乎所有行業和規模的客戶(包括初創公司、企業和公共部門組織)都在 AWS 上運行所有可能的使用案例。AWS 合作伙伴網絡 (APN) 包括專注于 AWS 服務的數千個系統集成商和成千上萬個將其技術應用到 AWS 中的獨立軟件供應商 (ISV)。

 

最安全
AWS 旨在成為當今市場上最靈活、最安全的云計算環境。我們的核心基礎設施是為了滿足軍事、全球的銀行和其他高度敏感性組織的安全要求而構建。一組深度云安全工具對此提供支持,其中包括超過 300 項安全、合規性和監管服務及功能,以及對 143 項安全標準和合規性認證的支持。

 

最快的創新速度
借助 AWS,您可以利用最新技術更快地進行實驗和創新。我們將不斷加快創新步伐,以發明您可用于轉變業務的全新技術。例如,在 2014 年,AWS 通過推出 AWS Lambda 在無服務器計算領域開創了先河,該平臺使開發人員無需預置或管理服務器即可運行其代碼。AWS 構建了 Amazon SageMaker,這是一種完全托管的機器學習服務,可讓日常開發人員和科學家無需任何前置經驗即可運用機器學習。

 

最成熟的運營專業能力
AWS 具有無與倫比的經驗、成熟度、可靠性、安全性和性能,您可以將其用于最重要的應用程序。在超過 17 年的時間中,AWS 一直在為運行各種使用案例的全球數百萬客戶提供云服務。在所有云服務提供商中,AWS 擁有最豐富的大規模運營經驗。

 

AWS 區域的全球網絡
AWS 擁有覆蓋范圍領先的全球云基礎設施。Gartner 已將 AWS 區域/可用區模型
視為一種值得推薦運行方式,適用于要求高可用性的企業應用程序。

<
合作案例
>
engie ascender caratlane
<
最可能同場景使用的其他API
>