語音轉(zhuǎn)文本-Google Cloud

語音轉(zhuǎn)文本-Google Cloud

專用API
服務商 服務商: Google
【更新時間: 2024.06.28】 Google Cloud語音轉(zhuǎn)文本使用功能強大的 API 將語音準確地轉(zhuǎn)換為文本。它通過使用準確的字幕轉(zhuǎn)錄您的語音來提供出色的用戶體驗。它還通過從客戶互動中獲取和轉(zhuǎn)錄的見解來幫助改進您的服務。
免費 (每月前 50 萬個字符) 去服務商官網(wǎng)采購>
瀏覽次數(shù)
106
采購人數(shù)
13
試用次數(shù)
0
! SLA: N/A
! 響應: N/A
! 適用于個人&企業(yè)
收藏
×
完成
取消
×
書簽名稱
確定
<
產(chǎn)品介紹
>

什么是Google Cloud的語音轉(zhuǎn)文本?

Google Cloud 依托 AI 技術(shù)的 API 可幫助您大規(guī)模翻譯文檔、網(wǎng)站、應用、音頻文件、視頻等內(nèi)容,并提供出色的質(zhì)量以及企業(yè)級控制和安全性。

什么是Google Cloud的語音轉(zhuǎn)文本接口?

由服務使用方的應用程序發(fā)起,以Restful風格為主、通過公網(wǎng)HTTP協(xié)議調(diào)用Google Cloud的語音轉(zhuǎn)文本,從而實現(xiàn)程序的自動化交互,提高服務效率。

Google Cloud的語音轉(zhuǎn)文本有哪些核心功能?

1. 高級語音 AI

Speech-to-Text 可以利用 Chirp,這是 Google Cloud 的語音基礎模型,使用數(shù)百萬小時的音頻數(shù)據(jù)和數(shù)十億個文本句子訓練而成。這與傳統(tǒng)語音識別技術(shù)(側(cè)重于大量特定于語言的監(jiān)督數(shù)據(jù))形成了鮮明對比。這些技術(shù)可以為用戶提高識別和轉(zhuǎn)錄能力,從而更好地理解口語和口音。

 支持 125 種語言和語言變體

通過廣泛的語言支持打造全球用戶群。轉(zhuǎn)錄短音頻、長音頻甚至流式傳輸?shù)囊纛l數(shù)據(jù)。Speech-to-Text 還利用新一代通用語音模型 Chirp,為用戶提供更加準確、覆蓋全球的翻譯和識別。Chirp 使用數(shù)百萬小時的音頻和 280 億個句子的文本(涵蓋 100 多種語言)的自監(jiān)督訓練構(gòu)建而成。

 

2. 用于轉(zhuǎn)寫的預訓練模型或可自定義的模型

多種經(jīng)過訓練的模型中進行選擇,實現(xiàn)優(yōu)化的語音控制、電話和視頻轉(zhuǎn)錄,滿足特定領(lǐng)域的質(zhì)量要求。通過 Speech-to-Text 界面,輕松自定義、試驗、創(chuàng)建和管理自定義資源。

 

3. 開箱即用的監(jiān)管和安全合規(guī)性

無需額外設置,Speech-to-Text API v2 即可幫助企業(yè)客戶滿足額外安全和監(jiān)管要求。數(shù)據(jù)駐留支持通過完全區(qū)域化的服務(該服務接入至新加坡和比利時等 Google Cloud 區(qū)域)來調(diào)用轉(zhuǎn)錄模型。借助識別器應變性 (resourcefulness),您無需使用專用服務賬號進行身份驗證和授權(quán)。您可以在 Google Cloud 控制臺中輕松查看關(guān)于資源生成和轉(zhuǎn)寫的日志。Speech-to-Text API v2 為所有資源以及批量轉(zhuǎn)錄提供使用客戶管理的加密密鑰的企業(yè)級加密。

 

4. AI 賦能的語音識別和轉(zhuǎn)錄

Speech-to-Text 使用模型自適應技術(shù)來提高常用字詞的準確性、擴充可用于轉(zhuǎn)錄的詞匯,并改善嘈雜音頻的轉(zhuǎn)錄效果。模型自適應可讓用戶自定義 Speech-to-Text,使其能夠更頻繁地使用同音字詞中的某一個而非建議的其他選項。例如,您可以讓 Speech-to-Text 在轉(zhuǎn)錄時更多地使用“時常”而不是“時長”。

 

Google Cloud的語音轉(zhuǎn)文本的核心優(yōu)勢是什么?

  1. 憑借 AI 技術(shù),保障出色的翻譯質(zhì)量以及企業(yè)級的控制和安全性。
  2. 運用 Google 的神經(jīng)機器翻譯技術(shù),支持使用預訓練的自定義模型或?qū)S么笳Z言模型(LLM)進行動態(tài)翻譯。
  3. 設有基礎和高級版本,高級版具備特定的自定義功能。
  4. 每月為用戶提供前 500,000 個字符(基礎版和高級版總計)的免費處理額度(LLM 除外)。

在哪些場景會用到Google Cloud的語音轉(zhuǎn)文本?

創(chuàng)建音頻轉(zhuǎn)寫內(nèi)容

了解如何在 Cloud 控制臺中使用 Speech-to-Text API 只通過幾個步驟創(chuàng)建音頻轉(zhuǎn)寫內(nèi)容。您還可以轉(zhuǎn)錄短音頻、長音頻和流式音頻。

利用 AI 為視頻創(chuàng)建字幕

轉(zhuǎn)寫音頻和視頻以添加字幕。為現(xiàn)有內(nèi)容添加字幕,或?qū)崟r向流式傳輸內(nèi)容添加字幕。我們的視頻轉(zhuǎn)寫模型非常適合為視頻和/或有多人說話的內(nèi)容編制索引或編排字幕,該模型使用與 YouTube 視頻字幕類似的機器學習技術(shù)。本教程介紹了如何使用 Google Cloud AI 服務 Speech-to-Text API 和 Translation API 為視頻添加字幕,以及提供其他語言的本地化字幕。

將 Speech-to-Text 添加到應用

了解如何借助 Google Cloud 快速輕松地為您的應用啟用 Speech-to-Text。此視頻介紹了如何在沒有大量機器學習模型經(jīng)驗的情況下將 AI 添加到您的應用。利用預訓練的 Speech-to-Text API,您可以快速輕松地為應用啟用 AI。

利用 Google Cloud API 處理語言、語音、文本和翻譯

在本課程中,您將使用 Speech-to-Text API 將音頻文件轉(zhuǎn)錄為文本文件,使用 Google Cloud Translation API 進行翻譯,并使用 Natural Language AI 創(chuàng)建合成語音。

<
產(chǎn)品價格
>

<
使用指南
>

如需使用 Google Cloud 提供的服務,您必須創(chuàng)建一個項目。項目用于組織您的所有 Google Cloud 資源。 項目由一組協(xié)作者、已啟用的 API(和其他資源)、監(jiān)控工具、結(jié)算信息以及身份驗證和訪問權(quán)限控制組成。您可以創(chuàng)建一個項目,也可以創(chuàng)建多個項目,并使用這些項目按資源層次結(jié)構(gòu)組織 Google Cloud 資源。創(chuàng)建項目時,請記下項目 ID。您需要此 ID 才能進行 API 調(diào)用。 如需詳細了解項目,請參閱 Resource Manager 文檔

您必須啟用結(jié)算功能才能使用 Cloud Translation。如需詳細了解 Cloud Translation 價格,請參閱價格頁面

您必須為項目啟用 Cloud Translation API。如需詳細了解如何啟用 API,請參閱 Service Usage 文檔

啟用 Cloud Translation API。

Cloud Translation 提供了配額管理系統(tǒng),可幫助您和 Google 管理服務的使用。默認情況下,您每天可以發(fā)送的字符數(shù)沒有限制。如果您設置了預算,則建議您監(jiān)控每日使用量,并根據(jù)您計劃的支出調(diào)整配額。

如需詳細了解配額,請參閱配額和限制

如果您計劃使用 Cloud Translation API,則需要設置身份驗證。任何使用 API 的客戶端應用都必須經(jīng)過身份驗證,并且擁有所請求資源的訪問權(quán)限。如需了解詳情,請參閱向 Cloud Translation 進行身份驗證

當主賬號(用戶賬號、服務賬號等)調(diào)用 API 時,Google Cloud 要求主賬號具有適當?shù)臋?quán)限。您可以通過向主賬號授予角色來授予權(quán)限。如需了解詳情,請參閱使用 IAM 控制訪問權(quán)限

 

指南詳情鏈接:https://cloud.google.com/translate/docs/setup?hl=zh-cn

<
產(chǎn)品問答
>
?
基礎版和高級版在功能上有哪些具體區(qū)別?
基礎版提供快速的動態(tài)翻譯,高級版除基礎功能外,還支持特定領(lǐng)域的翻譯、帶格式文檔的翻譯和批量翻譯等自定義功能。
?
免費的 500,000 個字符額度是如何計算的?
基礎版和高級版發(fā)送到 API 進行處理的字符數(shù)相加,每月前 500,000 個字符免費。
?
能否同時使用多個翻譯模型?
可以,根據(jù)具體需求和場景,靈活選擇和搭配使用不同的翻譯模型。
<
關(guān)于我們
>
Google
企業(yè)
Google云翻譯API提供多語言翻譯服務,支持100+語言,采用神經(jīng)機器翻譯技術(shù),提供高質(zhì)量翻譯結(jié)果,輕松集成到各種應用中。
聯(lián)系信息
服務時間: 0:00 - 24:00
電話號碼: +1 650-253-0000
網(wǎng)頁在線客服: 咨詢

為什么選擇 Google Cloud

科技發(fā)展正處于一個前所未有的時代。我們正經(jīng)歷 AI 技術(shù)所帶來的巨大變革。AI 技術(shù)開創(chuàng)了全新的方式,讓我們得以更高效地解決問題、與客戶互動和完成工作。Google Cloud 已經(jīng)蓄勢待發(fā),隨時準備幫助組織在日新月異的 AI 世界中開啟新的發(fā)展模式。

 

提高 AI 實力

生成式 AI 已經(jīng)成為全世界的話題焦點。接下來該怎么做呢? 讓組織中的每個人都學習生成式 AI 技術(shù),使用它構(gòu)建體驗并部署生成式 AI,同時確保您的數(shù)據(jù)安全無虞。立即體驗面向企業(yè)的生成式 AI 解決方案,開啟您的旅程。

 

讓數(shù)據(jù)發(fā)揮效用

將 Google 的信息方法帶入您的組織,利用其簡便性、規(guī)模、安全性和智能化助力組織發(fā)展。Google 可提供全面的數(shù)據(jù)基礎,幫您統(tǒng)一所有工作負載并管理整個數(shù)據(jù)生命周期。借助這一解決方案,您可以在任何位置運行數(shù)據(jù),在所有云環(huán)境和本地環(huán)境中使用數(shù)據(jù),亦可使用熱門的 SaaS 應用訪問數(shù)據(jù)。這一解決方案依托 AI 技術(shù)構(gòu)建且專為 AI 打造,為您提供有關(guān)機器學習分析的最新工具,讓您可以對自定義基礎模型執(zhí)行提示和調(diào)優(yōu)操作,訓練并部署這些模型 - 這些都與您的業(yè)務數(shù)據(jù)息息相關(guān)。

基礎架構(gòu)現(xiàn)代化改造

您已經(jīng)準備好在 AI 時代一展身手,但您的云架構(gòu)能否滿足新時代的要求?Google Cloud 可幫助開發(fā)者快速、安全地構(gòu)建經(jīng)濟高效的新一代現(xiàn)代化基礎架構(gòu),從而滿足特定的工作負載和行業(yè)需求。它可以為您提供針對 AI 優(yōu)化的基礎架構(gòu)、基于容器的應用、傳統(tǒng)企業(yè)工作負載以及高性能的分布式工作負載,同時幫助您降低成本和減少碳足跡。

打造創(chuàng)新文化

助力各種規(guī)模的團隊隨時隨地使用各種設備出色完成工作。Google Workspace 匯集了現(xiàn)代員工首選的協(xié)作和創(chuàng)作工具,包括 Gmail、Google Chat、Google 日歷、Google 云端硬盤、Google 文檔、Google 表格和 Google Meet。不僅如此,我們還在其中嵌入了易于使用的全新生成式 AI 功能,以幫助提高團隊工作效率。Workspace 擁有超過 30 億的月活躍用戶,提供了全球備受歡迎的辦公和協(xié)作軟件。

獲享內(nèi)置安全功能

受益于 Google 提供的安全功能的用戶和組織數(shù)不勝數(shù),您也同樣可以從這些功能中受益。借助 Mandiant 提供的一線情報,我們可以幫助組織實現(xiàn)信息安全轉(zhuǎn)型,讓他們了解最新的網(wǎng)絡攻擊。另外,我們還會為組織提供可檢測、調(diào)查和應對威脅的現(xiàn)代安全運營平臺,以及從設計和根本上保證安全的基礎架構(gòu)平臺,還有可幫助維護數(shù)字主權(quán)的各種控制措施。

<
最可能同場景使用的其他API
>
API接口列表
<
產(chǎn)品價格
>

<
使用指南
>

如需使用 Google Cloud 提供的服務,您必須創(chuàng)建一個項目。項目用于組織您的所有 Google Cloud 資源。 項目由一組協(xié)作者、已啟用的 API(和其他資源)、監(jiān)控工具、結(jié)算信息以及身份驗證和訪問權(quán)限控制組成。您可以創(chuàng)建一個項目,也可以創(chuàng)建多個項目,并使用這些項目按資源層次結(jié)構(gòu)組織 Google Cloud 資源。創(chuàng)建項目時,請記下項目 ID。您需要此 ID 才能進行 API 調(diào)用。 如需詳細了解項目,請參閱 Resource Manager 文檔

您必須啟用結(jié)算功能才能使用 Cloud Translation。如需詳細了解 Cloud Translation 價格,請參閱價格頁面

您必須為項目啟用 Cloud Translation API。如需詳細了解如何啟用 API,請參閱 Service Usage 文檔

啟用 Cloud Translation API。

Cloud Translation 提供了配額管理系統(tǒng),可幫助您和 Google 管理服務的使用。默認情況下,您每天可以發(fā)送的字符數(shù)沒有限制。如果您設置了預算,則建議您監(jiān)控每日使用量,并根據(jù)您計劃的支出調(diào)整配額。

如需詳細了解配額,請參閱配額和限制

如果您計劃使用 Cloud Translation API,則需要設置身份驗證。任何使用 API 的客戶端應用都必須經(jīng)過身份驗證,并且擁有所請求資源的訪問權(quán)限。如需了解詳情,請參閱向 Cloud Translation 進行身份驗證

當主賬號(用戶賬號、服務賬號等)調(diào)用 API 時,Google Cloud 要求主賬號具有適當?shù)臋?quán)限。您可以通過向主賬號授予角色來授予權(quán)限。如需了解詳情,請參閱使用 IAM 控制訪問權(quán)限

 

指南詳情鏈接:https://cloud.google.com/translate/docs/setup?hl=zh-cn

<
依賴服務
>
<
產(chǎn)品問答
>
?
基礎版和高級版在功能上有哪些具體區(qū)別?
基礎版提供快速的動態(tài)翻譯,高級版除基礎功能外,還支持特定領(lǐng)域的翻譯、帶格式文檔的翻譯和批量翻譯等自定義功能。
?
免費的 500,000 個字符額度是如何計算的?
基礎版和高級版發(fā)送到 API 進行處理的字符數(shù)相加,每月前 500,000 個字符免費。
?
能否同時使用多個翻譯模型?
可以,根據(jù)具體需求和場景,靈活選擇和搭配使用不同的翻譯模型。
<
關(guān)于我們
>
Google
企業(yè)
Google云翻譯API提供多語言翻譯服務,支持100+語言,采用神經(jīng)機器翻譯技術(shù),提供高質(zhì)量翻譯結(jié)果,輕松集成到各種應用中。
聯(lián)系信息
服務時間: 0:00 - 24:00
電話號碼: +1 650-253-0000
網(wǎng)頁在線客服: 咨詢

為什么選擇 Google Cloud

科技發(fā)展正處于一個前所未有的時代。我們正經(jīng)歷 AI 技術(shù)所帶來的巨大變革。AI 技術(shù)開創(chuàng)了全新的方式,讓我們得以更高效地解決問題、與客戶互動和完成工作。Google Cloud 已經(jīng)蓄勢待發(fā),隨時準備幫助組織在日新月異的 AI 世界中開啟新的發(fā)展模式。

 

提高 AI 實力

生成式 AI 已經(jīng)成為全世界的話題焦點。接下來該怎么做呢? 讓組織中的每個人都學習生成式 AI 技術(shù),使用它構(gòu)建體驗并部署生成式 AI,同時確保您的數(shù)據(jù)安全無虞。立即體驗面向企業(yè)的生成式 AI 解決方案,開啟您的旅程。

 

讓數(shù)據(jù)發(fā)揮效用

將 Google 的信息方法帶入您的組織,利用其簡便性、規(guī)模、安全性和智能化助力組織發(fā)展。Google 可提供全面的數(shù)據(jù)基礎,幫您統(tǒng)一所有工作負載并管理整個數(shù)據(jù)生命周期。借助這一解決方案,您可以在任何位置運行數(shù)據(jù),在所有云環(huán)境和本地環(huán)境中使用數(shù)據(jù),亦可使用熱門的 SaaS 應用訪問數(shù)據(jù)。這一解決方案依托 AI 技術(shù)構(gòu)建且專為 AI 打造,為您提供有關(guān)機器學習分析的最新工具,讓您可以對自定義基礎模型執(zhí)行提示和調(diào)優(yōu)操作,訓練并部署這些模型 - 這些都與您的業(yè)務數(shù)據(jù)息息相關(guān)。

基礎架構(gòu)現(xiàn)代化改造

您已經(jīng)準備好在 AI 時代一展身手,但您的云架構(gòu)能否滿足新時代的要求?Google Cloud 可幫助開發(fā)者快速、安全地構(gòu)建經(jīng)濟高效的新一代現(xiàn)代化基礎架構(gòu),從而滿足特定的工作負載和行業(yè)需求。它可以為您提供針對 AI 優(yōu)化的基礎架構(gòu)、基于容器的應用、傳統(tǒng)企業(yè)工作負載以及高性能的分布式工作負載,同時幫助您降低成本和減少碳足跡。

打造創(chuàng)新文化

助力各種規(guī)模的團隊隨時隨地使用各種設備出色完成工作。Google Workspace 匯集了現(xiàn)代員工首選的協(xié)作和創(chuàng)作工具,包括 Gmail、Google Chat、Google 日歷、Google 云端硬盤、Google 文檔、Google 表格和 Google Meet。不僅如此,我們還在其中嵌入了易于使用的全新生成式 AI 功能,以幫助提高團隊工作效率。Workspace 擁有超過 30 億的月活躍用戶,提供了全球備受歡迎的辦公和協(xié)作軟件。

獲享內(nèi)置安全功能

受益于 Google 提供的安全功能的用戶和組織數(shù)不勝數(shù),您也同樣可以從這些功能中受益。借助 Mandiant 提供的一線情報,我們可以幫助組織實現(xiàn)信息安全轉(zhuǎn)型,讓他們了解最新的網(wǎng)絡攻擊。另外,我們還會為組織提供可檢測、調(diào)查和應對威脅的現(xiàn)代安全運營平臺,以及從設計和根本上保證安全的基礎架構(gòu)平臺,還有可幫助維護數(shù)字主權(quán)的各種控制措施。

<
最可能同場景使用的其他API
>