revai語音文本理解產品

revai語音文本理解產品

專用API
服務商 服務商: revai
【更新時間: 2024.07.31】 世界上最準確的 AI 和人類生成轉錄本的 API。Rev AI 從世界上最多樣化的聲音集合中訓練而來,為視頻和語音應用設定了準確性標準。
瀏覽次數
26
采購人數
3
試用次數
0
! SLA: N/A
! 響應: N/A
! 適用于個人&企業
收藏
×
完成
取消
×
書簽名稱
確定
<
產品介紹
>

什么是revai語音文本理解產品?

 

RevAI語音文本理解產品是一種先進的技術解決方案,旨在通過深入分析音頻內容來提取關鍵信息和洞察,從而為企業決策提供有力支持。這種產品結合了自然語言處理

(NLP)和機器學習算法,能夠識別、轉錄并分析音頻數據中的語音內容,進而生成準確的文本輸出。

 

 

什么是revai語音文本理解產品接口?

由服務使用方的應用程序發起,以Restful風格為主、通過公網HTTP協議調用revai語音文本理解產品,從而實現程序的自動化交互,提高服務效率。

revai語音文本理解產品有哪些核心功能?

 

1.語言識別

 
在轉錄音頻或視頻文件之前,自動檢測音頻或視頻文件中使用的主要語言。語言識別會獲取音頻文件并返回最有可能使用的語言。 語言識別提供有關用戶在平臺上移動的音
頻的寶貴信息,并且可以 用于通知以哪種語言提交轉錄和字幕作業。支持22 種語言。
 
 
 
 
2.主題提取
 
在對話或長篇文本中公開關鍵主題和引語。主題提取從非結構化文本內容中查找排名靠前的關鍵字、短語和主題。 輸出的詳細程度可以通過簡單的調整參數進行更改。
 
 
 
 
3.情緒分析
 
發現內容中的正面、中立和負面陳述。情緒分數范圍從 -1 到 1 識別文本中的積極、消極和中性情緒。 直接對純文本或 Rev AI JSON 輸出進行操作。使用 JSON,還提供
了支持語句的時間戳。
 
 
 
 

revai語音文本理解產品的核心優勢是什么?

 
 
1.一流精度:
 
通過先進的語音識別技術和大量的數據訓練,使得其語音識別引擎具備了強大的適應性和準確性,能夠應對各種口音、語速及噪音環境下的語音識別任務。

 

 

 


當轉錄準確性很重要時,您可以依靠 Rev AI,

Rev AI 的 ASR 是最準確的

 

2.集成簡單:
 
我們易于使用的 API 由開發人員為開發人員設計。
我們為您提供SDK、全面的文檔和專家 支持,以便您可以在幾分鐘內開始。所有你需要的生成第一個成績單是訪問令牌。
 
 
 
3.易于實施:設置并在一小時內查看結果。我們的 SDK 集合可讓您立即啟動并運行。

4.靈活部署:根據您的需求在云端或本地部署 Rev AI 的語音轉文本引擎。

5.可靠性:我們保持 99.99% 的正常運行時間,并隨時待命以響應安全警報和事件。

6.安全:我們會以應有的謹慎處理您的數據。所有文件都通過行業最佳實踐進行靜態加密和傳輸中加密。

revai語音文本理解產品有哪些使用限制?

流式語音轉文本 API 存在以下限制:

  • 流并發限制為 10。
  • 每個流的時間限制為 3 小時。

當您的流接近 3 小時限制時,您應該初始化新的并發 WebSocket 連接。接受 WebSocket 連接并收到類型消息后,可以切換到新的 WebSocket 并開始將音頻流式傳輸到其中。

 

在哪些場景會用到revai語音文本理解產品?

 

 

公司將 Rev AI 用于多種用例, 包括商業智能、市場和用戶研究、會議轉錄、 以及手動任務的擴展。

 

媒體和娛樂

法律與合規

教育

呼叫中心和分析



大規模為視頻添加字幕,提高內容

的可訪問性和可搜索性,并提高

視頻編輯效率。提高實時Web 或

廣播內容的可訪問性。


將 AI 語音識別用于數字證詞、

電子取證、通話錄音、風險分

析和法庭報告。

通過預先錄制的課程提高講座、

網絡研討會和活動的可訪問性。


監控座席質量、培訓座席、對呼叫

進行分類并進行呼叫后分析,以改善

客戶體驗,同時降低運營成本。

<
產品價格
>

透明靈活的定價,助您成長


適用于音頻和視頻應用程序的語音轉文本 API

 

 

流持續時間和音頻持續時間:

    流持續時間是指自 WebSocket 連接建立以來經過的實際秒數。音頻持續時間是指通過 WebSocket 連接發送的音頻的秒數。 對于大多數用例,這兩者不會有顯著差異,

作為用戶,它們的差異可以忽略不計。但我們在這里單獨引用它們,因為它們可能因您的實現而異。

    在初始連接時,每個流會話都會嘗試保留 10 分鐘的積分。如果客戶端沒有 10 分鐘的積分可以保留,則 WebSocket 將返回關閉消息。每當超過 5 分鐘的實時時間(流

持續時間)過去時,Rev AI 就會嘗試保留另外 5 分鐘的積分。同樣,如果客戶端的配額用完,則 WebSocket 連接將關閉并顯示關閉消息。建議啟用自動重新加載,以防止

積分在中途用完。

     關閉連接后,音頻持續時間和流持續時間將最終確定。任何未使用的積分都將取消保留。任何暫時擱置的額外積分都將退還給客戶,并可用于其他轉錄工作。您將為兩者

中較大的一個付費,至少需要 15 秒。

 

<
使用指南
>

開始使用

這個簡短的教程將教您向 Rev AI API 發出請求的基礎知識。本教程使用異步語音轉文本 API 生成你提交的音頻文件的腳本。

 

假設

本教程假定您有一個 Rev AI 帳戶。如果沒有,請注冊一個免費帳戶

 

 

 

第 1 步:獲取訪問令牌

第一步是生成訪問令牌,該令牌將允許訪問 Rev AI API。請按照下列步驟操作:

  1. 登錄 Rev AI。

    2.導航到“訪問令牌”頁面

    3.單擊“生成新的訪問令牌”鏈接。在彈出的對話框中確認操作。

 

Creating an access token

將生成新的訪問令牌并顯示在屏幕上。

警告

將您的訪問令牌保存在安全的地方;您只能看到它們一次。一次最多允許 2 個訪問令牌。

 

 

 

第 2 步:提交文件進行轉錄

 

使用以下命令將音頻文件提交到 Rev AI 進行轉錄。將占位符替換為在步驟 1 中獲取的訪問令牌,并根據需要將下面顯示的示例文件 URL 替換為您自己的音頻文件的 URL。

 
curl -X POST "https://api.rev.ai/speechtotext/v1/jobs" \
     -H "Authorization: Bearer <REVAI_ACCESS_TOKEN>" \
     -H "Content-Type: application/json" \
     -d '{"source_config": {"url": "https://www.rev.ai/FTC_Sample_1.mp3"},"metadata":"This is a test"}'

您將收到如下回復:

 
{
  "id": "Umx5c6F7pH7r",
  "created_on": "2021-09-15T05:14:38.13",
  "name": "FTC_Sample_1.mp3",
  "metadata": "This is a test",
  "status": "in_progress",
  "type": "async",
  "language": "en"
}

(在本例中)將使您能夠檢索您的成績單。

 
 
 
 

第 3 步:檢索成績單

 

您現在需要等待作業完成。等待大約 1 分鐘,然后通過查詢 API 檢查作業,如下所示:

 
curl -X GET https://api.rev.ai/speechtotext/v1/jobs/<ID> \
     -H "Authorization: Bearer <REVAI_ACCESS_TOKEN>"
警告

不建議在生產服務器中定期輪詢 API 以獲取作業狀態。相反,在聽錄作業完成后,使用 Webhook 異步接收通知。

一旦聽錄作業更改為 ,您可以通過運行以下命令以 JSON 格式檢索腳本。如前所述,將占位符替換為在步驟 1 中獲取的訪問令牌。還必須將占位符替換為在步驟 2 中獲得的占位符。

 
curl -X GET "https://api.rev.ai/speechtotext/v1/jobs/<ID>/transcript" \
     -H "Authorization: Bearer <REVAI_ACCESS_TOKEN>" \
     -H "Accept: application/vnd.rev.transcript.v1.0+json"

 

下面是輸出的示例:

 
{
  "monologues": [
    {
      "speaker": 1,
      "elements": [
        {
          "type": "text",
          "value": "Hi",
          "ts": 0.27,
          "end_ts": 0.32,
          "confidence": 1
        },
        {
          "type": "punct",
          "value": ","
        },
        {
          "type": "punct",
          "value": " "
        },        
        {
          "type": "text",
          "value": "my",
          "ts": 0.35,
          "end_ts": 0.46,
          "confidence": 1
        },
        {
          "type": "punct",
          "value": " "
        },
        {
          "type": "text",
          "value": "name's",
          "ts": 0.47,
          "end_ts": 0.59,
          "confidence": 1
        },
        {
          ...
        }
      ]
    },
    {
      ...
    }
  ]
}

或者,您可以通過運行以下命令來獲取明文版本:

 
curl -X GET "https://api.rev.ai/speechtotext/v1/jobs/<ID>/transcript" \
     -H "Authorization: Bearer <REVAI_ACCESS_TOKEN>" \
     -H "Accept: text/plain"

 

 

后續步驟

您現在應該對如何使用 Rev AI API 有一個基本的想法。要了解更多信息,請閱讀 API 文檔,了解有關可用不同 API 及其功能的完整詳細信息。您還可以找到代碼示例和 SDK 文檔,以幫助您將應用程序與 API 連接起來。

<
關于我們
>
revai
企業
Rev AI 是一家提供全球最準確語音轉文字API的公司,支持58種以上語言的語音識別服務。公司提供異步、流媒體、人工轉錄等多種服務,并提供語言識別、情感分析、主題提取、摘要和翻譯等洞察功能。Rev AI 以其低錯誤率、高準確性、多語言支持和高可讀性轉錄而著稱,同時提供世界級的安全標準和靈活的部署選項。
聯系信息
服務時間: 00:00:00至24:00:00
電話號碼: 1(888) 369-0701
郵箱: support@rev.ai
<
最可能同場景使用的其他API
>
API接口列表
<
產品價格
>

透明靈活的定價,助您成長


適用于音頻和視頻應用程序的語音轉文本 API

 

 

流持續時間和音頻持續時間:

    流持續時間是指自 WebSocket 連接建立以來經過的實際秒數。音頻持續時間是指通過 WebSocket 連接發送的音頻的秒數。 對于大多數用例,這兩者不會有顯著差異,

作為用戶,它們的差異可以忽略不計。但我們在這里單獨引用它們,因為它們可能因您的實現而異。

    在初始連接時,每個流會話都會嘗試保留 10 分鐘的積分。如果客戶端沒有 10 分鐘的積分可以保留,則 WebSocket 將返回關閉消息。每當超過 5 分鐘的實時時間(流

持續時間)過去時,Rev AI 就會嘗試保留另外 5 分鐘的積分。同樣,如果客戶端的配額用完,則 WebSocket 連接將關閉并顯示關閉消息。建議啟用自動重新加載,以防止

積分在中途用完。

     關閉連接后,音頻持續時間和流持續時間將最終確定。任何未使用的積分都將取消保留。任何暫時擱置的額外積分都將退還給客戶,并可用于其他轉錄工作。您將為兩者

中較大的一個付費,至少需要 15 秒。

 

<
使用指南
>

開始使用

這個簡短的教程將教您向 Rev AI API 發出請求的基礎知識。本教程使用異步語音轉文本 API 生成你提交的音頻文件的腳本。

 

假設

本教程假定您有一個 Rev AI 帳戶。如果沒有,請注冊一個免費帳戶

 

 

 

第 1 步:獲取訪問令牌

第一步是生成訪問令牌,該令牌將允許訪問 Rev AI API。請按照下列步驟操作:

  1. 登錄 Rev AI。

    2.導航到“訪問令牌”頁面

    3.單擊“生成新的訪問令牌”鏈接。在彈出的對話框中確認操作。

 

Creating an access token

將生成新的訪問令牌并顯示在屏幕上。

警告

將您的訪問令牌保存在安全的地方;您只能看到它們一次。一次最多允許 2 個訪問令牌。

 

 

 

第 2 步:提交文件進行轉錄

 

使用以下命令將音頻文件提交到 Rev AI 進行轉錄。將占位符替換為在步驟 1 中獲取的訪問令牌,并根據需要將下面顯示的示例文件 URL 替換為您自己的音頻文件的 URL。

 
curl -X POST "https://api.rev.ai/speechtotext/v1/jobs" \
     -H "Authorization: Bearer <REVAI_ACCESS_TOKEN>" \
     -H "Content-Type: application/json" \
     -d '{"source_config": {"url": "https://www.rev.ai/FTC_Sample_1.mp3"},"metadata":"This is a test"}'

您將收到如下回復:

 
{
  "id": "Umx5c6F7pH7r",
  "created_on": "2021-09-15T05:14:38.13",
  "name": "FTC_Sample_1.mp3",
  "metadata": "This is a test",
  "status": "in_progress",
  "type": "async",
  "language": "en"
}

(在本例中)將使您能夠檢索您的成績單。

 
 
 
 

第 3 步:檢索成績單

 

您現在需要等待作業完成。等待大約 1 分鐘,然后通過查詢 API 檢查作業,如下所示:

 
curl -X GET https://api.rev.ai/speechtotext/v1/jobs/<ID> \
     -H "Authorization: Bearer <REVAI_ACCESS_TOKEN>"
警告

不建議在生產服務器中定期輪詢 API 以獲取作業狀態。相反,在聽錄作業完成后,使用 Webhook 異步接收通知。

一旦聽錄作業更改為 ,您可以通過運行以下命令以 JSON 格式檢索腳本。如前所述,將占位符替換為在步驟 1 中獲取的訪問令牌。還必須將占位符替換為在步驟 2 中獲得的占位符。

 
curl -X GET "https://api.rev.ai/speechtotext/v1/jobs/<ID>/transcript" \
     -H "Authorization: Bearer <REVAI_ACCESS_TOKEN>" \
     -H "Accept: application/vnd.rev.transcript.v1.0+json"

 

下面是輸出的示例:

 
{
  "monologues": [
    {
      "speaker": 1,
      "elements": [
        {
          "type": "text",
          "value": "Hi",
          "ts": 0.27,
          "end_ts": 0.32,
          "confidence": 1
        },
        {
          "type": "punct",
          "value": ","
        },
        {
          "type": "punct",
          "value": " "
        },        
        {
          "type": "text",
          "value": "my",
          "ts": 0.35,
          "end_ts": 0.46,
          "confidence": 1
        },
        {
          "type": "punct",
          "value": " "
        },
        {
          "type": "text",
          "value": "name's",
          "ts": 0.47,
          "end_ts": 0.59,
          "confidence": 1
        },
        {
          ...
        }
      ]
    },
    {
      ...
    }
  ]
}

或者,您可以通過運行以下命令來獲取明文版本:

 
curl -X GET "https://api.rev.ai/speechtotext/v1/jobs/<ID>/transcript" \
     -H "Authorization: Bearer <REVAI_ACCESS_TOKEN>" \
     -H "Accept: text/plain"

 

 

后續步驟

您現在應該對如何使用 Rev AI API 有一個基本的想法。要了解更多信息,請閱讀 API 文檔,了解有關可用不同 API 及其功能的完整詳細信息。您還可以找到代碼示例和 SDK 文檔,以幫助您將應用程序與 API 連接起來。

<
依賴服務
>
<
關于我們
>
revai
企業
Rev AI 是一家提供全球最準確語音轉文字API的公司,支持58種以上語言的語音識別服務。公司提供異步、流媒體、人工轉錄等多種服務,并提供語言識別、情感分析、主題提取、摘要和翻譯等洞察功能。Rev AI 以其低錯誤率、高準確性、多語言支持和高可讀性轉錄而著稱,同時提供世界級的安全標準和靈活的部署選項。
聯系信息
服務時間: 00:00:00至24:00:00
電話號碼: 1(888) 369-0701
郵箱: support@rev.ai
<
最可能同場景使用的其他API
>