![]() |
AI 語音轉文本服務-Speechmatics
專用API
【更新時間: 2024.08.07】
Speechmatics AI 語音生成器,融合了精準的語音識別技術與前沿的人工智能及大型語言模型(LLM)。通過API接口,它能夠處理50種語言的轉錄、翻譯和語義理解,為多語言環境提供強大支持。
|
瀏覽次數
117
采購人數
7
試用次數
2
試用
收藏
×
完成
取消
×
書簽名稱
確定
|
- API詳情
- 定價
- 使用指南
- 常見 FAQ
- 關于我們
- 相關推薦


什么是Speechmatics的AI 語音轉文本服務?
Speechmatics AI 語音生成器是將準確的語音識別與最新的 AI 和 LLM 技術相結合,所有這些都通過一個 API 實現。支持 50 種語言的轉錄、翻譯和理解,使用最準確、最全面的語音 API 為您的應用程序提供支持。專為 50 多種語言的實時轉錄和翻譯而打造。我們的尖端語音技術由語音 AI 領域的先驅者開發,確保您能夠以最佳方式進行構建。
什么是Speechmatics的AI 語音轉文本服務接口?
Speechmatics的AI 語音轉文本服務有哪些核心功能?
- 高精度轉錄:提供無與倫比的轉錄準確性,無論是實時轉錄還是批處理模式,都能確保最佳性能和快速轉錄,支持自定義詞典、說話者和頻道分類、數字格式識別等功能,以進一步提高轉錄精度。
- 靈活部署:支持本地和云兩種部署方式。用戶可以根據自己的需求在本地環境中托管API,或者通過云部署獲得安全且可擴展的訪問,提供Docker容器或預配置的虛擬設備,方便用戶在自己的架構、安全性和合規性需求下部署。
- 多語言支持:支持50種語言,涵蓋大多數母語,并具備處理各種方言和口音的能力,提供翻譯功能,可以將音頻轉錄并翻譯為超過30種語言,或進行英語之間的互譯,自動檢測所說的語言,確保準確的轉錄。
- 高級功能:提供置信度分數、單詞計時、高級標點符號和大小寫等功能,幫助用戶進行高效的后期處理和編輯,支持音頻事件識別,如自動檢測和標記媒體中的非語音聲音,提高可訪問性并自動化字幕制作。
- 行業優化:提供針對行業優化的英語語言包,包含特定行業的術語,如財務等,并計劃推出更多行業語言包。
- AI支持功能:結合精準的轉錄與語音功能,提供如翻譯、摘要、情緒分析、主題識別和章節劃分等高級AI功能,摘要功能自動生成視頻或社交媒體平臺的摘要,方便觀眾快速了解內容,情緒分析功能幫助了解客戶對服務的感受,主題和章節功能提供討論的主題和時間戳,提升觀眾參與度。
Speechmatics的AI 語音轉文本服務的核心優勢是什么?
|
|
單一、統一的API |
|
自動語言識別 無需設置預期語言(盡管如果您愿意也可以設置)Speechmatics將自動識別輸入語言以確保最高的準確性。 |
|
自定義詞典 準確捕捉最專業的詞匯 - 公司名稱行業術語、俚語等等。使用自定義詞典您絕對不會錯過任何一個單詞。 |
|
![]() |
直播。即時。實時 |
無與倫比的精度 即使在充滿挑戰的環境中我們為各種聲音提供了前所未有的性能,并在現實世界和暗雜的環境中進行了壓力測試.因此您始終可以信賴我們的輸出。 |
|
![]() |
尋找新受眾 |
在哪些場景會用到Speechmatics的AI 語音轉文本服務?
- Red Bee 讓每個人都能參與體育運動:Red Bee 幫助英國第四頻道成為第一家播放完全無障礙殘奧會的廣播公司。
-
視頻團隊的工作空間:Red Bee 幫助英國第四頻道成為第一家播放完全無障礙殘奧會的廣播公司。
- 利用語音識別進行實時字幕廣播:Red Bee 幫助英國第四頻道成為第一家播放完全無障礙殘奧會的廣播公司。




Speechmatics 為轉錄提供了兩個操作點:
- 增強——針對盡可能高的準確度進行了優化。
- 標準 - (默認)針對快速批量周轉時間進行了優化。
請注意,實時轉錄時,標準和增強操作點的延遲都由此處max_delay
描述的配置選項控制。
請注意,您選擇的操作點將影響定價以及本地客戶的處理成本效率。
{
"type": "transcription",
"transcription_config": {
"language": "en",
"operating_point": "enhanced"
}
}
輸出區域
僅對于英語語言包,可以根據output_locale
配置設置指定生成轉錄時要使用的拼寫規則。
可用的三種英語區域設置是:
- 英式英語 (en-GB)
- 美國英語 (en-US)
- 澳大利亞英語 (en-AU)
用英語轉錄時,建議指定語言環境。如果沒有指定語言環境,轉錄中的拼寫可能會不一致。
以下區域支持中文普通話:
- 簡體普通話 (cmn-Hans)
- 繁體普通話 (cmn-Hant)
默認是簡體普通話。
示例配置請求如下:
{
"type": "transcription",
"transcription_config": {
"language": "en",
"output_locale": "en-GB"
}
}
域名語言優化
一些 Speechmatics 語言包針對特定領域進行了優化,這些領域需要對特定詞匯和術語具有高精度。使用域參數可提供額外的轉錄準確性。以下示例顯示了雙語西班牙語和英語模型的使用:
{
"type": "transcription",
"transcription_config": {
"language": "es",
"domain": "bilingual-en"
}
}
預計雖然特定領域會有所改進,但該領域之外的其他領域的準確性可能會下降。




我們的目標是理解每一個聲音
在 Speechmatics,我們創建了有史以來最全面、最準確的語音 API。我們通過為企業提供 AI 時代的基礎語音技術來改變企業的工作方式。
我們的故事
Speechmatics 的故事始于 20 世紀 80 年代,當時創始人托尼·羅賓遜博士在劍橋大學率先采用神經網絡方法解決語音識別問題。
我們的價值
我們的價值觀指導著我們在這里所做的一切。僅僅取得偉大的成就是不夠的-我們的價值觀讓我們知道我們在以正確的方式做事,
深切關懷 我們的目標是“理解每一個聲音”。這種想法 不僅僅延伸到我們的技術。我們非常關心我 們的客戶,尤其是當涉及到我們的行為對世 界的影響時。 |
以人為本 我們信奉以人為本的理念。我們想要的不只 是最好的團隊,我們想要最合適的人。當您 成為我們團隊的一員時,我們將竭盡所能幫 助您發展技能。 |
有雄心壯志 要想在行業內做出積極的改變,就需要采取 大膽、有遠見的行動。這就是我們相信遠大 目標的原因。我們的結果表明,雖然改變從 來都不容易,但總是值得的。 |
快速移動 我們相信在復雜和簡單之間找到完美的平 衡。當你成為像我們這樣的協作團隊的一員 時,你可以自由地快速失敗并繼續前進。 |




Speechmatics 為轉錄提供了兩個操作點:
- 增強——針對盡可能高的準確度進行了優化。
- 標準 - (默認)針對快速批量周轉時間進行了優化。
請注意,實時轉錄時,標準和增強操作點的延遲都由此處max_delay
描述的配置選項控制。
請注意,您選擇的操作點將影響定價以及本地客戶的處理成本效率。
{
"type": "transcription",
"transcription_config": {
"language": "en",
"operating_point": "enhanced"
}
}
輸出區域
僅對于英語語言包,可以根據output_locale
配置設置指定生成轉錄時要使用的拼寫規則。
可用的三種英語區域設置是:
- 英式英語 (en-GB)
- 美國英語 (en-US)
- 澳大利亞英語 (en-AU)
用英語轉錄時,建議指定語言環境。如果沒有指定語言環境,轉錄中的拼寫可能會不一致。
以下區域支持中文普通話:
- 簡體普通話 (cmn-Hans)
- 繁體普通話 (cmn-Hant)
默認是簡體普通話。
示例配置請求如下:
{
"type": "transcription",
"transcription_config": {
"language": "en",
"output_locale": "en-GB"
}
}
域名語言優化
一些 Speechmatics 語言包針對特定領域進行了優化,這些領域需要對特定詞匯和術語具有高精度。使用域參數可提供額外的轉錄準確性。以下示例顯示了雙語西班牙語和英語模型的使用:
{
"type": "transcription",
"transcription_config": {
"language": "es",
"domain": "bilingual-en"
}
}
預計雖然特定領域會有所改進,但該領域之外的其他領域的準確性可能會下降。






我們的目標是理解每一個聲音
在 Speechmatics,我們創建了有史以來最全面、最準確的語音 API。我們通過為企業提供 AI 時代的基礎語音技術來改變企業的工作方式。
我們的故事
Speechmatics 的故事始于 20 世紀 80 年代,當時創始人托尼·羅賓遜博士在劍橋大學率先采用神經網絡方法解決語音識別問題。
我們的價值
我們的價值觀指導著我們在這里所做的一切。僅僅取得偉大的成就是不夠的-我們的價值觀讓我們知道我們在以正確的方式做事,
深切關懷 我們的目標是“理解每一個聲音”。這種想法 不僅僅延伸到我們的技術。我們非常關心我 們的客戶,尤其是當涉及到我們的行為對世 界的影響時。 |
以人為本 我們信奉以人為本的理念。我們想要的不只 是最好的團隊,我們想要最合適的人。當您 成為我們團隊的一員時,我們將竭盡所能幫 助您發展技能。 |
有雄心壯志 要想在行業內做出積極的改變,就需要采取 大膽、有遠見的行動。這就是我們相信遠大 目標的原因。我們的結果表明,雖然改變從 來都不容易,但總是值得的。 |
快速移動 我們相信在復雜和簡單之間找到完美的平 衡。當你成為像我們這樣的協作團隊的一員 時,你可以自由地快速失敗并繼續前進。 |