Amazon 文本轉語音服務-Polly

Amazon 文本轉語音服務-Polly

專用API
【更新時間: 2024.06.19】 Amazon Polly 是一種將文本換為逼真語音的服務,借助文字轉語音服務,您可以創建能夠說話的應用程序,并構建全新類別的支持語音功能的產品。文字到語音支持多種語言。
瀏覽次數
70
采購人數
0
試用次數
0
! SLA: N/A
! 響應: N/A
! 適用于個人&企業
收藏
×
完成
取消
×
書簽名稱
確定
<
產品介紹
>

什么是Polly的Amazon 文本轉語音服務?

Amazon Polly 是 Amazon Web Services (AWS) 提供的一項文本轉語音(Text-to-Speech, TTS)服務。它允許開發人員將文本內容轉換為自然、類似人聲的語音輸出。通過 Polly 的 API,用戶可以將任何文本轉換為高質量的音頻流,這些音頻流可以直接播放,或者作為文件保存。

什么是Polly的Amazon 文本轉語音服務接口?

由服務使用方的應用程序發起,以Restful風格為主、通過公網HTTP協議調用Polly的Amazon 文本轉語音服務,從而實現程序的自動化交互,提高服務效率。

Polly的Amazon 文本轉語音服務有哪些核心功能?

  1. 高質量的語音輸出:提供逼真的語音,支持多種語言和方言。
  2. 廣泛的語音和語言選擇:提供多種標準語音和神經文本轉語音(NTTS)聲音,并支持多種語言。
  3. 語音同步的元數據:提供與語音輸出同步的元數據,用于改善視覺體驗,如語音同步的面部動畫或文字突出提示。
  4. 靈活的音頻格式和采樣率:支持多種音頻格式和采樣率,以適應不同的帶寬和音頻質量要求。
  5. 語音合成標記語言(SSML)支持:支持 SSML 標簽,以進行更高級的文本處理,如斷句、重音和語調調整。
  6. 自定義詞典:允許用戶自定義特定詞語的發音,以適應品牌名稱、首字母縮略詞等。
  7. 品牌之聲:為組織提供定制化的神經文本轉語音(NTTS)語音,以創建獨特的品牌聲音。

Polly的Amazon 文本轉語音服務的技術原理是什么?

Amazon Polly 使用深度學習技術來合成聽起來自然的人類語音,讓您可以將文章轉換為語音。借助多種語言的數十種逼真的聲音,使用 Amazon Polly 構建語音激活的應用程序。

  1. 創建內容
  2. 在線學習
  3. 電話語音

Polly的Amazon 文本轉語音服務的核心優勢是什么?

  1. 多語言語音生成
    • 在面向全球受眾的應用程序(如RSS源、網站或視頻)中,支持數十種語言的語音生成。
  2. 自然聲音吸引客戶
    • 利用Amazon Polly的語音輸出,以自然的聲音吸引并存儲客戶語音,便于在交互式或自動語音響應系統中對來電客戶進行語音提示。
  3. 語音屬性調整
    • 支持使用SSML(語音合成標記語言),這是一種基于XML的W3C標準標記語言,用于調整說話風格、語速、音調和音量。
    • 適用于語音合成應用程序,支持斷句、重音和語調等通用SSML標簽。
  4. 自定義語音輸出
    • 提供自定義選項,支持詞典和SSML標簽的語音輸出控制。
  5. 標準格式存儲與重放
    • 語音可以以標準格式(如MP3和OGG)進行存儲和重放,便于在各種設備和平臺上使用。
  6. 快速響應與逼真體驗
    • 提供一貫的快速響應速度,確保用戶獲得逼真的聲音和對話式用戶體驗。

在哪些場景會用到Polly的Amazon 文本轉語音服務?

  1. 輔助技術:為視覺障礙或閱讀困難的用戶提供有聲讀物、網頁內容或應用內文本的有聲版本。
  2. 智能助手和聊天機器人:為 Alexa 技能、聊天機器人或智能助手提供自然、逼真的語音響應。
  3. 教育應用:用于語言學習、閱讀輔助或電子教材的有聲化。
  4. 視頻和播客:為視頻內容添加旁白,或為播客生成音頻內容。
<
產品價格
>
按實際使用量付費模式

您按月付費,計費依據是您處理的文本的字符數量。Amazon Polly 的標準語音定價為:對于超出免費套餐的語音或語音標記請求,每 100 萬個字符 4.00 USD。Amazon Polly 的神經語音定價為:對于超出免費套餐的語音或請求的語音標記,每 100 萬個字符 16.00 USD。Amazon Polly 的長格式語音定價為:對于超出免費套餐的語音或請求的語音標記,每 100 萬個字符 100.00 USD。 Amazon Polly 的生成式語音定價為:對于超出免費套餐的語音請求,每 100 萬個字符 30 USD。

每月數百萬個字符

對于 Amazon Polly 的標準語音,從您提交第一個 Polly 語音或語音標記請求起 12 個月內,針對該類請求,免費套餐每個月提供 500 萬個字符服務。對于神經語音,從您提交第一個語音或語音標記請求起 12 個月內,針對該類請求,免費套餐每個月提供 100 萬個字符服務。對于長格式語音,從您提交第一個 Polly 語音或語音標記請求起 12 個月內,針對該類請求,免費套餐每個月提供 50 萬個字符服務。 對于生成式語音,從您提交第一個 Polly 語音請求起 12 個月內,針對該類請求,免費套餐每個月提供 10 萬字符的服務。

<
使用指南
>
Step 1 - Sign up for an Amazon Web Services account
設置并登錄您的 AWS 賬戶 觀看網絡研討會并閱讀文檔。 登錄 Polly 控制臺并開始構建。
<
產品問答
>
?
什么是 Amazon Polly?
Amazon Polly 是一項將文本轉換為逼真語音的服務。Amazon Polly 可以為現有應用程序添加先進的語音功能,支持構建具有語音功能的全新類別產品,從移動應用程序和汽車到設備和家電,均涵蓋其中。Amazon Polly 可以提供幾十種逼真的語音并支持多種語言,因此您可以選擇最合適的語音,并在許多地理位置發布具有語音功能的應用程序。Amazon Polly 簡單易用 – 您只需將要轉換為語音的文本發送到 Amazon Polly API,Amazon Polly 便會立即將音頻流返回到您的應用程序。您可以直接播放該音頻流,也可將其存儲為 MP3 等標準音頻文件格式。Amazon Polly 支持語音合成標記語言 (SSML) 標簽(如 prosody),因此您可以調整語速、音調或音量。Amazon Polly 是一種安全的服務,能夠大規模地實現以上所有功能,且延遲較低。您可以緩存并重播 Amazon Polly 生成的語音,無需額外付費。注冊 Amazon Polly 后,您可在第一年內每月免費轉換數百萬個字符。Amazon Polly 采用按需付費定價模式,對每條請求收取的費用較低,且對語音輸出的存儲和重復使用沒有太多限制,讓您能夠經濟高效在任何地方實現語音合成。
?
為什么要使用 Amazon Polly?
您可以使用 Amazon Polly 為您的應用程序提供高質量的語音輸出。Amazon Polly 是一項經濟高效的服務,可以在極短的時間內做出響應,且幾乎適用于各種使用情形,對存儲和重復使用生成的語音也沒有任何限制。
?
Amazon Polly 可以提供哪些功能?
您可以使用標準化的語音合成標記語言 (SSML) 控制語音的各個方面,如發音、音量、音調、語速等。您可以使用新聞播音員風格為某些神經語音合成語音,使其聽起來像電視或無線電新聞播音員。您可以根據音頻流中的元數據,檢測用戶聽到文本中的特定文字或語句的時間。這讓開發人員能夠將突出顯示的圖形和動畫(例如頭像的嘴唇動作)與合成語音同步。您可以使用自定義字典修改公司名稱、首字母縮略詞、外來詞和新詞等特定詞語的發音,例如“P!nk”、“ROTFL”和“C'est la vie”(使用非法語語音說話時)。
?
什么是語音標記?
語音標記用于補充從輸入文本生成的合成語音。將這一元數據流與合成語音音頻流配合使用,客戶能夠在應用程序中提供增強的視覺體驗,例如語音同步動畫或者卡拉 ok 式突出提示。 Amazon Polly 使用以下四種元素來生成語音標記: 語句,指明要朗讀的輸入文本中的語句元素; 文字,指明文本中的文字元素; 視位,描述與發出的聲音對應的嘴唇形狀; SSML,描述文本中使用的 SSML 元素。 語音標記以 JSON 流(具體指一組由新線隔開的獨立 JSON 對象)的形式交付,在使用合成語音方法處理語音標記類參數時,涵蓋上面一個到全部四個元素中的任何位置。有關更多信息,請參閱《Amazon Polly 開發人員指南》。
?
Amazon Polly 服務最常見的使用案例有哪些?
借助 Amazon Polly,您可以添加逼真的語音功能,讓您的應用程序生動起來。例如,在電子學習和教育中,您可以利用 Amazon Polly 的文本轉語音 (TTS) 功能構建應用程序,幫助有閱讀障礙的人。Amazon Polly 可以用于幫助盲人和視障人士使用數字內容(例如電子書、新聞等)。Amazon Polly 還可用于公共交通和工業控制系統的通知系統,發布通知和緊急公告。很多設備(如機頂盒、智能手表、平板電腦、智能手機和 IoT 設備)都可以利用 Amazon Polly 來提供音頻輸出。Amazon Polly 可以用于電話服務解決方案,為交互式語音應答系統提供語音支持。問答游戲、動畫、頭像或旁白生成等應用程序是 Amazon Polly 等基于云的 TTS 解決方案的常見使用案例。
<
關于我們
>
亞馬遜云科技(Amazon Web Services,簡稱AWS)是全球領先的云計算服務提供商,提供包括計算、存儲、數據庫、分析、機器學習、物聯網、移動、安全、混合云、虛擬和增強現實等在內的廣泛服務。AWS在全球34個地理區域內運營108個可用區,服務超過200個國家和地區,幫助企業、開發者和政府機構構建靈活、可靠、可擴展的云基礎設施。作為亞馬遜公司的一部分,AWS致力于提供創新的云解決方案,支持客戶實現數字化轉型。
聯系信息
服務時間: 早9:00-晚8:00 (法定假期除外)
電話號碼: +86 (10) 1010 0866
網頁在線客服: 咨詢

AWS 云計算

Amazon Web Services(AWS)是全球最全面、應用最廣泛的云,從全球數據中心提供超過 200 項功能齊全的服務。數百萬客戶(包括增長最快速的初創公司、最大型企業和主要的政府機構)都在使用 AWS 來降低成本、提高敏捷性并加速創新。

 

最多的功能
從計算、存儲和數據庫等基礎設施技術,到機器學習、人工智能、數據湖和分析以及物聯網等新興技術,AWS 提供的服務以及其中的功能比其他任何云服務提供商的都要多得多。這使得將現有應用程序遷移到云中并構建您可以想象的幾乎任何東西都變得更快、更容易且更具成本效益。

AWS 的這些服務還具有最為多樣復雜的功能。例如,AWS 提供了種類繁多的數據庫,這些數據庫是為不同類型的應用程序專門構建的,因此您可以選擇適合作業的工具來獲得最佳的成本和性能。

 

最大的客戶和合作伙伴社區
AWS 擁有最大且最具活力的社區,在全球擁有數百萬活躍客戶和成千上萬個合作伙伴。幾乎所有行業和規模的客戶(包括初創公司、企業和公共部門組織)都在 AWS 上運行所有可能的使用案例。AWS 合作伙伴網絡 (APN) 包括專注于 AWS 服務的數千個系統集成商和成千上萬個將其技術應用到 AWS 中的獨立軟件供應商 (ISV)。

 

最安全
AWS 旨在成為當今市場上最靈活、最安全的云計算環境。我們的核心基礎設施是為了滿足軍事、全球的銀行和其他高度敏感性組織的安全要求而構建。一組深度云安全工具對此提供支持,其中包括超過 300 項安全、合規性和監管服務及功能,以及對 143 項安全標準和合規性認證的支持。

 

最快的創新速度
借助 AWS,您可以利用最新技術更快地進行實驗和創新。我們將不斷加快創新步伐,以發明您可用于轉變業務的全新技術。例如,在 2014 年,AWS 通過推出 AWS Lambda 在無服務器計算領域開創了先河,該平臺使開發人員無需預置或管理服務器即可運行其代碼。AWS 構建了 Amazon SageMaker,這是一種完全托管的機器學習服務,可讓日常開發人員和科學家無需任何前置經驗即可運用機器學習。

 

最成熟的運營專業能力
AWS 具有無與倫比的經驗、成熟度、可靠性、安全性和性能,您可以將其用于最重要的應用程序。在超過 17 年的時間中,AWS 一直在為運行各種使用案例的全球數百萬客戶提供云服務。在所有云服務提供商中,AWS 擁有最豐富的大規模運營經驗。

 

AWS 區域的全球網絡
AWS 擁有覆蓋范圍領先的全球云基礎設施。Gartner 已將 AWS 區域/可用區模型
視為一種值得推薦運行方式,適用于要求高可用性的企業應用程序。

<
最可能同場景使用的其他API
>
API接口列表
<
產品價格
>
按實際使用量付費模式

您按月付費,計費依據是您處理的文本的字符數量。Amazon Polly 的標準語音定價為:對于超出免費套餐的語音或語音標記請求,每 100 萬個字符 4.00 USD。Amazon Polly 的神經語音定價為:對于超出免費套餐的語音或請求的語音標記,每 100 萬個字符 16.00 USD。Amazon Polly 的長格式語音定價為:對于超出免費套餐的語音或請求的語音標記,每 100 萬個字符 100.00 USD。 Amazon Polly 的生成式語音定價為:對于超出免費套餐的語音請求,每 100 萬個字符 30 USD。

每月數百萬個字符

對于 Amazon Polly 的標準語音,從您提交第一個 Polly 語音或語音標記請求起 12 個月內,針對該類請求,免費套餐每個月提供 500 萬個字符服務。對于神經語音,從您提交第一個語音或語音標記請求起 12 個月內,針對該類請求,免費套餐每個月提供 100 萬個字符服務。對于長格式語音,從您提交第一個 Polly 語音或語音標記請求起 12 個月內,針對該類請求,免費套餐每個月提供 50 萬個字符服務。 對于生成式語音,從您提交第一個 Polly 語音請求起 12 個月內,針對該類請求,免費套餐每個月提供 10 萬字符的服務。

<
使用指南
>
Step 1 - Sign up for an Amazon Web Services account
設置并登錄您的 AWS 賬戶 觀看網絡研討會并閱讀文檔。 登錄 Polly 控制臺并開始構建。
<
依賴服務
>
<
產品問答
>
?
什么是 Amazon Polly?
Amazon Polly 是一項將文本轉換為逼真語音的服務。Amazon Polly 可以為現有應用程序添加先進的語音功能,支持構建具有語音功能的全新類別產品,從移動應用程序和汽車到設備和家電,均涵蓋其中。Amazon Polly 可以提供幾十種逼真的語音并支持多種語言,因此您可以選擇最合適的語音,并在許多地理位置發布具有語音功能的應用程序。Amazon Polly 簡單易用 – 您只需將要轉換為語音的文本發送到 Amazon Polly API,Amazon Polly 便會立即將音頻流返回到您的應用程序。您可以直接播放該音頻流,也可將其存儲為 MP3 等標準音頻文件格式。Amazon Polly 支持語音合成標記語言 (SSML) 標簽(如 prosody),因此您可以調整語速、音調或音量。Amazon Polly 是一種安全的服務,能夠大規模地實現以上所有功能,且延遲較低。您可以緩存并重播 Amazon Polly 生成的語音,無需額外付費。注冊 Amazon Polly 后,您可在第一年內每月免費轉換數百萬個字符。Amazon Polly 采用按需付費定價模式,對每條請求收取的費用較低,且對語音輸出的存儲和重復使用沒有太多限制,讓您能夠經濟高效在任何地方實現語音合成。
?
為什么要使用 Amazon Polly?
您可以使用 Amazon Polly 為您的應用程序提供高質量的語音輸出。Amazon Polly 是一項經濟高效的服務,可以在極短的時間內做出響應,且幾乎適用于各種使用情形,對存儲和重復使用生成的語音也沒有任何限制。
?
Amazon Polly 可以提供哪些功能?
您可以使用標準化的語音合成標記語言 (SSML) 控制語音的各個方面,如發音、音量、音調、語速等。您可以使用新聞播音員風格為某些神經語音合成語音,使其聽起來像電視或無線電新聞播音員。您可以根據音頻流中的元數據,檢測用戶聽到文本中的特定文字或語句的時間。這讓開發人員能夠將突出顯示的圖形和動畫(例如頭像的嘴唇動作)與合成語音同步。您可以使用自定義字典修改公司名稱、首字母縮略詞、外來詞和新詞等特定詞語的發音,例如“P!nk”、“ROTFL”和“C'est la vie”(使用非法語語音說話時)。
?
什么是語音標記?
語音標記用于補充從輸入文本生成的合成語音。將這一元數據流與合成語音音頻流配合使用,客戶能夠在應用程序中提供增強的視覺體驗,例如語音同步動畫或者卡拉 ok 式突出提示。 Amazon Polly 使用以下四種元素來生成語音標記: 語句,指明要朗讀的輸入文本中的語句元素; 文字,指明文本中的文字元素; 視位,描述與發出的聲音對應的嘴唇形狀; SSML,描述文本中使用的 SSML 元素。 語音標記以 JSON 流(具體指一組由新線隔開的獨立 JSON 對象)的形式交付,在使用合成語音方法處理語音標記類參數時,涵蓋上面一個到全部四個元素中的任何位置。有關更多信息,請參閱《Amazon Polly 開發人員指南》。
?
Amazon Polly 服務最常見的使用案例有哪些?
借助 Amazon Polly,您可以添加逼真的語音功能,讓您的應用程序生動起來。例如,在電子學習和教育中,您可以利用 Amazon Polly 的文本轉語音 (TTS) 功能構建應用程序,幫助有閱讀障礙的人。Amazon Polly 可以用于幫助盲人和視障人士使用數字內容(例如電子書、新聞等)。Amazon Polly 還可用于公共交通和工業控制系統的通知系統,發布通知和緊急公告。很多設備(如機頂盒、智能手表、平板電腦、智能手機和 IoT 設備)都可以利用 Amazon Polly 來提供音頻輸出。Amazon Polly 可以用于電話服務解決方案,為交互式語音應答系統提供語音支持。問答游戲、動畫、頭像或旁白生成等應用程序是 Amazon Polly 等基于云的 TTS 解決方案的常見使用案例。
<
關于我們
>
亞馬遜云科技(Amazon Web Services,簡稱AWS)是全球領先的云計算服務提供商,提供包括計算、存儲、數據庫、分析、機器學習、物聯網、移動、安全、混合云、虛擬和增強現實等在內的廣泛服務。AWS在全球34個地理區域內運營108個可用區,服務超過200個國家和地區,幫助企業、開發者和政府機構構建靈活、可靠、可擴展的云基礎設施。作為亞馬遜公司的一部分,AWS致力于提供創新的云解決方案,支持客戶實現數字化轉型。
聯系信息
服務時間: 早9:00-晚8:00 (法定假期除外)
電話號碼: +86 (10) 1010 0866
網頁在線客服: 咨詢

AWS 云計算

Amazon Web Services(AWS)是全球最全面、應用最廣泛的云,從全球數據中心提供超過 200 項功能齊全的服務。數百萬客戶(包括增長最快速的初創公司、最大型企業和主要的政府機構)都在使用 AWS 來降低成本、提高敏捷性并加速創新。

 

最多的功能
從計算、存儲和數據庫等基礎設施技術,到機器學習、人工智能、數據湖和分析以及物聯網等新興技術,AWS 提供的服務以及其中的功能比其他任何云服務提供商的都要多得多。這使得將現有應用程序遷移到云中并構建您可以想象的幾乎任何東西都變得更快、更容易且更具成本效益。

AWS 的這些服務還具有最為多樣復雜的功能。例如,AWS 提供了種類繁多的數據庫,這些數據庫是為不同類型的應用程序專門構建的,因此您可以選擇適合作業的工具來獲得最佳的成本和性能。

 

最大的客戶和合作伙伴社區
AWS 擁有最大且最具活力的社區,在全球擁有數百萬活躍客戶和成千上萬個合作伙伴。幾乎所有行業和規模的客戶(包括初創公司、企業和公共部門組織)都在 AWS 上運行所有可能的使用案例。AWS 合作伙伴網絡 (APN) 包括專注于 AWS 服務的數千個系統集成商和成千上萬個將其技術應用到 AWS 中的獨立軟件供應商 (ISV)。

 

最安全
AWS 旨在成為當今市場上最靈活、最安全的云計算環境。我們的核心基礎設施是為了滿足軍事、全球的銀行和其他高度敏感性組織的安全要求而構建。一組深度云安全工具對此提供支持,其中包括超過 300 項安全、合規性和監管服務及功能,以及對 143 項安全標準和合規性認證的支持。

 

最快的創新速度
借助 AWS,您可以利用最新技術更快地進行實驗和創新。我們將不斷加快創新步伐,以發明您可用于轉變業務的全新技術。例如,在 2014 年,AWS 通過推出 AWS Lambda 在無服務器計算領域開創了先河,該平臺使開發人員無需預置或管理服務器即可運行其代碼。AWS 構建了 Amazon SageMaker,這是一種完全托管的機器學習服務,可讓日常開發人員和科學家無需任何前置經驗即可運用機器學習。

 

最成熟的運營專業能力
AWS 具有無與倫比的經驗、成熟度、可靠性、安全性和性能,您可以將其用于最重要的應用程序。在超過 17 年的時間中,AWS 一直在為運行各種使用案例的全球數百萬客戶提供云服務。在所有云服務提供商中,AWS 擁有最豐富的大規模運營經驗。

 

AWS 區域的全球網絡
AWS 擁有覆蓋范圍領先的全球云基礎設施。Gartner 已將 AWS 區域/可用區模型
視為一種值得推薦運行方式,適用于要求高可用性的企業應用程序。

<
合作案例
>
engie ascender caratlane
<
最可能同場景使用的其他API
>