revai語音文本理解產(chǎn)品

revai語音文本理解產(chǎn)品

專用API
服務(wù)商 服務(wù)商: revai
【更新時間: 2024.07.31】 世界上最準(zhǔn)確的 AI 和人類生成轉(zhuǎn)錄本的 API。Rev AI 從世界上最多樣化的聲音集合中訓(xùn)練而來,為視頻和語音應(yīng)用設(shè)定了準(zhǔn)確性標(biāo)準(zhǔn)。
瀏覽次數(shù)
26
采購人數(shù)
3
試用次數(shù)
0
! SLA: N/A
! 響應(yīng): N/A
! 適用于個人&企業(yè)
收藏
×
完成
取消
×
書簽名稱
確定
<
產(chǎn)品介紹
>

什么是revai語音文本理解產(chǎn)品?

 

RevAI語音文本理解產(chǎn)品是一種先進的技術(shù)解決方案,旨在通過深入分析音頻內(nèi)容來提取關(guān)鍵信息和洞察,從而為企業(yè)決策提供有力支持。這種產(chǎn)品結(jié)合了自然語言處理

(NLP)和機器學(xué)習(xí)算法,能夠識別、轉(zhuǎn)錄并分析音頻數(shù)據(jù)中的語音內(nèi)容,進而生成準(zhǔn)確的文本輸出。

 

 

什么是revai語音文本理解產(chǎn)品接口?

由服務(wù)使用方的應(yīng)用程序發(fā)起,以Restful風(fēng)格為主、通過公網(wǎng)HTTP協(xié)議調(diào)用revai語音文本理解產(chǎn)品,從而實現(xiàn)程序的自動化交互,提高服務(wù)效率。

revai語音文本理解產(chǎn)品有哪些核心功能?

 

1.語言識別

 
在轉(zhuǎn)錄音頻或視頻文件之前,自動檢測音頻或視頻文件中使用的主要語言。語言識別會獲取音頻文件并返回最有可能使用的語言。 語言識別提供有關(guān)用戶在平臺上移動的音
頻的寶貴信息,并且可以 用于通知以哪種語言提交轉(zhuǎn)錄和字幕作業(yè)。支持22 種語言。
 
 
 
 
2.主題提取
 
在對話或長篇文本中公開關(guān)鍵主題和引語。主題提取從非結(jié)構(gòu)化文本內(nèi)容中查找排名靠前的關(guān)鍵字、短語和主題。 輸出的詳細程度可以通過簡單的調(diào)整參數(shù)進行更改。
 
 
 
 
3.情緒分析
 
發(fā)現(xiàn)內(nèi)容中的正面、中立和負面陳述。情緒分?jǐn)?shù)范圍從 -1 到 1 識別文本中的積極、消極和中性情緒。 直接對純文本或 Rev AI JSON 輸出進行操作。使用 JSON,還提供
了支持語句的時間戳。
 
 
 
 

revai語音文本理解產(chǎn)品的核心優(yōu)勢是什么?

 
 
1.一流精度:
 
通過先進的語音識別技術(shù)和大量的數(shù)據(jù)訓(xùn)練,使得其語音識別引擎具備了強大的適應(yīng)性和準(zhǔn)確性,能夠應(yīng)對各種口音、語速及噪音環(huán)境下的語音識別任務(wù)。

 

 

 


當(dāng)轉(zhuǎn)錄準(zhǔn)確性很重要時,您可以依靠 Rev AI,

Rev AI 的 ASR 是最準(zhǔn)確的

 

2.集成簡單:
 
我們易于使用的 API 由開發(fā)人員為開發(fā)人員設(shè)計。
我們?yōu)槟峁㏒DK、全面的文檔和專家 支持,以便您可以在幾分鐘內(nèi)開始。所有你需要的生成第一個成績單是訪問令牌。
 
 
 
3.易于實施:設(shè)置并在一小時內(nèi)查看結(jié)果。我們的 SDK 集合可讓您立即啟動并運行。

4.靈活部署:根據(jù)您的需求在云端或本地部署 Rev AI 的語音轉(zhuǎn)文本引擎。

5.可靠性:我們保持 99.99% 的正常運行時間,并隨時待命以響應(yīng)安全警報和事件。

6.安全:我們會以應(yīng)有的謹(jǐn)慎處理您的數(shù)據(jù)。所有文件都通過行業(yè)最佳實踐進行靜態(tài)加密和傳輸中加密。

revai語音文本理解產(chǎn)品有哪些使用限制?

流式語音轉(zhuǎn)文本 API 存在以下限制:

  • 流并發(fā)限制為 10。
  • 每個流的時間限制為 3 小時。

當(dāng)您的流接近 3 小時限制時,您應(yīng)該初始化新的并發(fā) WebSocket 連接。接受 WebSocket 連接并收到類型消息后,可以切換到新的 WebSocket 并開始將音頻流式傳輸?shù)狡渲小?/p>

 

在哪些場景會用到revai語音文本理解產(chǎn)品?

 

 

公司將 Rev AI 用于多種用例, 包括商業(yè)智能、市場和用戶研究、會議轉(zhuǎn)錄、 以及手動任務(wù)的擴展。

 

媒體和娛樂

法律與合規(guī)

教育

呼叫中心和分析



大規(guī)模為視頻添加字幕,提高內(nèi)容

的可訪問性和可搜索性,并提高

視頻編輯效率。提高實時Web 或

廣播內(nèi)容的可訪問性。


將 AI 語音識別用于數(shù)字證詞、

電子取證、通話錄音、風(fēng)險分

析和法庭報告。

通過預(yù)先錄制的課程提高講座、

網(wǎng)絡(luò)研討會和活動的可訪問性。


監(jiān)控座席質(zhì)量、培訓(xùn)座席、對呼叫

進行分類并進行呼叫后分析,以改善

客戶體驗,同時降低運營成本。

<
產(chǎn)品價格
>

透明靈活的定價,助您成長


適用于音頻和視頻應(yīng)用程序的語音轉(zhuǎn)文本 API

 

 

流持續(xù)時間和音頻持續(xù)時間:

    流持續(xù)時間是指自 WebSocket 連接建立以來經(jīng)過的實際秒數(shù)。音頻持續(xù)時間是指通過 WebSocket 連接發(fā)送的音頻的秒數(shù)。 對于大多數(shù)用例,這兩者不會有顯著差異,

作為用戶,它們的差異可以忽略不計。但我們在這里單獨引用它們,因為它們可能因您的實現(xiàn)而異。

    在初始連接時,每個流會話都會嘗試保留 10 分鐘的積分。如果客戶端沒有 10 分鐘的積分可以保留,則 WebSocket 將返回關(guān)閉消息。每當(dāng)超過 5 分鐘的實時時間(流

持續(xù)時間)過去時,Rev AI 就會嘗試保留另外 5 分鐘的積分。同樣,如果客戶端的配額用完,則 WebSocket 連接將關(guān)閉并顯示關(guān)閉消息。建議啟用自動重新加載,以防止

積分在中途用完。

     關(guān)閉連接后,音頻持續(xù)時間和流持續(xù)時間將最終確定。任何未使用的積分都將取消保留。任何暫時擱置的額外積分都將退還給客戶,并可用于其他轉(zhuǎn)錄工作。您將為兩者

中較大的一個付費,至少需要 15 秒。

 

<
使用指南
>

開始使用

這個簡短的教程將教您向 Rev AI API 發(fā)出請求的基礎(chǔ)知識。本教程使用異步語音轉(zhuǎn)文本 API 生成你提交的音頻文件的腳本。

 

假設(shè)

本教程假定您有一個 Rev AI 帳戶。如果沒有,請注冊一個免費帳戶

 

 

 

第 1 步:獲取訪問令牌

第一步是生成訪問令牌,該令牌將允許訪問 Rev AI API。請按照下列步驟操作:

  1. 登錄 Rev AI。

    2.導(dǎo)航到“訪問令牌”頁面

    3.單擊“生成新的訪問令牌”鏈接。在彈出的對話框中確認操作。

 

Creating an access token

將生成新的訪問令牌并顯示在屏幕上。

警告

將您的訪問令牌保存在安全的地方;您只能看到它們一次。一次最多允許 2 個訪問令牌。

 

 

 

第 2 步:提交文件進行轉(zhuǎn)錄

 

使用以下命令將音頻文件提交到 Rev AI 進行轉(zhuǎn)錄。將占位符替換為在步驟 1 中獲取的訪問令牌,并根據(jù)需要將下面顯示的示例文件 URL 替換為您自己的音頻文件的 URL。

 
curl -X POST "https://api.rev.ai/speechtotext/v1/jobs" \
     -H "Authorization: Bearer <REVAI_ACCESS_TOKEN>" \
     -H "Content-Type: application/json" \
     -d '{"source_config": {"url": "https://www.rev.ai/FTC_Sample_1.mp3"},"metadata":"This is a test"}'

您將收到如下回復(fù):

 
{
  "id": "Umx5c6F7pH7r",
  "created_on": "2021-09-15T05:14:38.13",
  "name": "FTC_Sample_1.mp3",
  "metadata": "This is a test",
  "status": "in_progress",
  "type": "async",
  "language": "en"
}

(在本例中)將使您能夠檢索您的成績單。

 
 
 
 

第 3 步:檢索成績單

 

您現(xiàn)在需要等待作業(yè)完成。等待大約 1 分鐘,然后通過查詢 API 檢查作業(yè),如下所示:

 
curl -X GET https://api.rev.ai/speechtotext/v1/jobs/<ID> \
     -H "Authorization: Bearer <REVAI_ACCESS_TOKEN>"
警告

不建議在生產(chǎn)服務(wù)器中定期輪詢 API 以獲取作業(yè)狀態(tài)。相反,在聽錄作業(yè)完成后,使用 Webhook 異步接收通知。

一旦聽錄作業(yè)更改為 ,您可以通過運行以下命令以 JSON 格式檢索腳本。如前所述,將占位符替換為在步驟 1 中獲取的訪問令牌。還必須將占位符替換為在步驟 2 中獲得的占位符。

 
curl -X GET "https://api.rev.ai/speechtotext/v1/jobs/<ID>/transcript" \
     -H "Authorization: Bearer <REVAI_ACCESS_TOKEN>" \
     -H "Accept: application/vnd.rev.transcript.v1.0+json"

 

下面是輸出的示例:

 
{
  "monologues": [
    {
      "speaker": 1,
      "elements": [
        {
          "type": "text",
          "value": "Hi",
          "ts": 0.27,
          "end_ts": 0.32,
          "confidence": 1
        },
        {
          "type": "punct",
          "value": ","
        },
        {
          "type": "punct",
          "value": " "
        },        
        {
          "type": "text",
          "value": "my",
          "ts": 0.35,
          "end_ts": 0.46,
          "confidence": 1
        },
        {
          "type": "punct",
          "value": " "
        },
        {
          "type": "text",
          "value": "name's",
          "ts": 0.47,
          "end_ts": 0.59,
          "confidence": 1
        },
        {
          ...
        }
      ]
    },
    {
      ...
    }
  ]
}

或者,您可以通過運行以下命令來獲取明文版本:

 
curl -X GET "https://api.rev.ai/speechtotext/v1/jobs/<ID>/transcript" \
     -H "Authorization: Bearer <REVAI_ACCESS_TOKEN>" \
     -H "Accept: text/plain"

 

 

后續(xù)步驟

您現(xiàn)在應(yīng)該對如何使用 Rev AI API 有一個基本的想法。要了解更多信息,請閱讀 API 文檔,了解有關(guān)可用不同 API 及其功能的完整詳細信息。您還可以找到代碼示例和 SDK 文檔,以幫助您將應(yīng)用程序與 API 連接起來。

<
關(guān)于我們
>
revai
企業(yè)
Rev AI 是一家提供全球最準(zhǔn)確語音轉(zhuǎn)文字API的公司,支持58種以上語言的語音識別服務(wù)。公司提供異步、流媒體、人工轉(zhuǎn)錄等多種服務(wù),并提供語言識別、情感分析、主題提取、摘要和翻譯等洞察功能。Rev AI 以其低錯誤率、高準(zhǔn)確性、多語言支持和高可讀性轉(zhuǎn)錄而著稱,同時提供世界級的安全標(biāo)準(zhǔn)和靈活的部署選項。
聯(lián)系信息
服務(wù)時間: 00:00:00至24:00:00
電話號碼: 1(888) 369-0701
郵箱: support@rev.ai
<
最可能同場景使用的其他API
>
API接口列表
<
產(chǎn)品價格
>

透明靈活的定價,助您成長


適用于音頻和視頻應(yīng)用程序的語音轉(zhuǎn)文本 API

 

 

流持續(xù)時間和音頻持續(xù)時間:

    流持續(xù)時間是指自 WebSocket 連接建立以來經(jīng)過的實際秒數(shù)。音頻持續(xù)時間是指通過 WebSocket 連接發(fā)送的音頻的秒數(shù)。 對于大多數(shù)用例,這兩者不會有顯著差異,

作為用戶,它們的差異可以忽略不計。但我們在這里單獨引用它們,因為它們可能因您的實現(xiàn)而異。

    在初始連接時,每個流會話都會嘗試保留 10 分鐘的積分。如果客戶端沒有 10 分鐘的積分可以保留,則 WebSocket 將返回關(guān)閉消息。每當(dāng)超過 5 分鐘的實時時間(流

持續(xù)時間)過去時,Rev AI 就會嘗試保留另外 5 分鐘的積分。同樣,如果客戶端的配額用完,則 WebSocket 連接將關(guān)閉并顯示關(guān)閉消息。建議啟用自動重新加載,以防止

積分在中途用完。

     關(guān)閉連接后,音頻持續(xù)時間和流持續(xù)時間將最終確定。任何未使用的積分都將取消保留。任何暫時擱置的額外積分都將退還給客戶,并可用于其他轉(zhuǎn)錄工作。您將為兩者

中較大的一個付費,至少需要 15 秒。

 

<
使用指南
>

開始使用

這個簡短的教程將教您向 Rev AI API 發(fā)出請求的基礎(chǔ)知識。本教程使用異步語音轉(zhuǎn)文本 API 生成你提交的音頻文件的腳本。

 

假設(shè)

本教程假定您有一個 Rev AI 帳戶。如果沒有,請注冊一個免費帳戶

 

 

 

第 1 步:獲取訪問令牌

第一步是生成訪問令牌,該令牌將允許訪問 Rev AI API。請按照下列步驟操作:

  1. 登錄 Rev AI。

    2.導(dǎo)航到“訪問令牌”頁面

    3.單擊“生成新的訪問令牌”鏈接。在彈出的對話框中確認操作。

 

Creating an access token

將生成新的訪問令牌并顯示在屏幕上。

警告

將您的訪問令牌保存在安全的地方;您只能看到它們一次。一次最多允許 2 個訪問令牌。

 

 

 

第 2 步:提交文件進行轉(zhuǎn)錄

 

使用以下命令將音頻文件提交到 Rev AI 進行轉(zhuǎn)錄。將占位符替換為在步驟 1 中獲取的訪問令牌,并根據(jù)需要將下面顯示的示例文件 URL 替換為您自己的音頻文件的 URL。

 
curl -X POST "https://api.rev.ai/speechtotext/v1/jobs" \
     -H "Authorization: Bearer <REVAI_ACCESS_TOKEN>" \
     -H "Content-Type: application/json" \
     -d '{"source_config": {"url": "https://www.rev.ai/FTC_Sample_1.mp3"},"metadata":"This is a test"}'

您將收到如下回復(fù):

 
{
  "id": "Umx5c6F7pH7r",
  "created_on": "2021-09-15T05:14:38.13",
  "name": "FTC_Sample_1.mp3",
  "metadata": "This is a test",
  "status": "in_progress",
  "type": "async",
  "language": "en"
}

(在本例中)將使您能夠檢索您的成績單。

 
 
 
 

第 3 步:檢索成績單

 

您現(xiàn)在需要等待作業(yè)完成。等待大約 1 分鐘,然后通過查詢 API 檢查作業(yè),如下所示:

 
curl -X GET https://api.rev.ai/speechtotext/v1/jobs/<ID> \
     -H "Authorization: Bearer <REVAI_ACCESS_TOKEN>"
警告

不建議在生產(chǎn)服務(wù)器中定期輪詢 API 以獲取作業(yè)狀態(tài)。相反,在聽錄作業(yè)完成后,使用 Webhook 異步接收通知。

一旦聽錄作業(yè)更改為 ,您可以通過運行以下命令以 JSON 格式檢索腳本。如前所述,將占位符替換為在步驟 1 中獲取的訪問令牌。還必須將占位符替換為在步驟 2 中獲得的占位符。

 
curl -X GET "https://api.rev.ai/speechtotext/v1/jobs/<ID>/transcript" \
     -H "Authorization: Bearer <REVAI_ACCESS_TOKEN>" \
     -H "Accept: application/vnd.rev.transcript.v1.0+json"

 

下面是輸出的示例:

 
{
  "monologues": [
    {
      "speaker": 1,
      "elements": [
        {
          "type": "text",
          "value": "Hi",
          "ts": 0.27,
          "end_ts": 0.32,
          "confidence": 1
        },
        {
          "type": "punct",
          "value": ","
        },
        {
          "type": "punct",
          "value": " "
        },        
        {
          "type": "text",
          "value": "my",
          "ts": 0.35,
          "end_ts": 0.46,
          "confidence": 1
        },
        {
          "type": "punct",
          "value": " "
        },
        {
          "type": "text",
          "value": "name's",
          "ts": 0.47,
          "end_ts": 0.59,
          "confidence": 1
        },
        {
          ...
        }
      ]
    },
    {
      ...
    }
  ]
}

或者,您可以通過運行以下命令來獲取明文版本:

 
curl -X GET "https://api.rev.ai/speechtotext/v1/jobs/<ID>/transcript" \
     -H "Authorization: Bearer <REVAI_ACCESS_TOKEN>" \
     -H "Accept: text/plain"

 

 

后續(xù)步驟

您現(xiàn)在應(yīng)該對如何使用 Rev AI API 有一個基本的想法。要了解更多信息,請閱讀 API 文檔,了解有關(guān)可用不同 API 及其功能的完整詳細信息。您還可以找到代碼示例和 SDK 文檔,以幫助您將應(yīng)用程序與 API 連接起來。

<
依賴服務(wù)
>
<
關(guān)于我們
>
revai
企業(yè)
Rev AI 是一家提供全球最準(zhǔn)確語音轉(zhuǎn)文字API的公司,支持58種以上語言的語音識別服務(wù)。公司提供異步、流媒體、人工轉(zhuǎn)錄等多種服務(wù),并提供語言識別、情感分析、主題提取、摘要和翻譯等洞察功能。Rev AI 以其低錯誤率、高準(zhǔn)確性、多語言支持和高可讀性轉(zhuǎn)錄而著稱,同時提供世界級的安全標(biāo)準(zhǔn)和靈活的部署選項。
聯(lián)系信息
服務(wù)時間: 00:00:00至24:00:00
電話號碼: 1(888) 369-0701
郵箱: support@rev.ai
<
最可能同場景使用的其他API
>