![]() |
revai語音文本理解產品
專用API
【更新時間: 2024.07.31】
世界上最準確的 AI 和人類生成轉錄本的 API。Rev AI 從世界上最多樣化的聲音集合中訓練而來,為視頻和語音應用設定了準確性標準。
咨詢
去服務商官網采購>
|
瀏覽次數
26
采購人數
3
試用次數
0
收藏
×
完成
取消
×
書簽名稱
確定
|
- API詳情
- 定價
- 使用指南
- 關于我們
- 相關推薦


什么是revai語音文本理解產品?
RevAI語音文本理解產品是一種先進的技術解決方案,旨在通過深入分析音頻內容來提取關鍵信息和洞察,從而為企業決策提供有力支持。這種產品結合了自然語言處理
(NLP)和機器學習算法,能夠識別、轉錄并分析音頻數據中的語音內容,進而生成準確的文本輸出。
什么是revai語音文本理解產品接口?
revai語音文本理解產品有哪些核心功能?
1.語言識別
revai語音文本理解產品的核心優勢是什么?
Rev AI 的 ASR 是最準確的 |
2.集成簡單:

4.靈活部署:根據您的需求在云端或本地部署 Rev AI 的語音轉文本引擎。
5.可靠性:我們保持 99.99% 的正常運行時間,并隨時待命以響應安全警報和事件。
6.安全:我們會以應有的謹慎處理您的數據。所有文件都通過行業最佳實踐進行靜態加密和傳輸中加密。
revai語音文本理解產品有哪些使用限制?
流式語音轉文本 API 存在以下限制:
- 流并發限制為 10。
- 每個流的時間限制為 3 小時。
當您的流接近 3 小時限制時,您應該初始化新的并發 WebSocket 連接。接受 WebSocket 連接并收到類型消息后,可以切換到新的 WebSocket 并開始將音頻流式傳輸到其中。
在哪些場景會用到revai語音文本理解產品?
公司將 Rev AI 用于多種用例, 包括商業智能、市場和用戶研究、會議轉錄、 以及手動任務的擴展。
媒體和娛樂 |
法律與合規 |
教育 |
呼叫中心和分析 |
的可訪問性和可搜索性,并提高 視頻編輯效率。提高實時Web 或 廣播內容的可訪問性。 |
電子取證、通話錄音、風險分 析和法庭報告。 |
通過預先錄制的課程提高講座、 網絡研討會和活動的可訪問性。 |
進行分類并進行呼叫后分析,以改善 客戶體驗,同時降低運營成本。 |


透明靈活的定價,助您成長
適用于音頻和視頻應用程序的語音轉文本 API
流持續時間和音頻持續時間:
流持續時間是指自 WebSocket 連接建立以來經過的實際秒數。音頻持續時間是指通過 WebSocket 連接發送的音頻的秒數。 對于大多數用例,這兩者不會有顯著差異,
作為用戶,它們的差異可以忽略不計。但我們在這里單獨引用它們,因為它們可能因您的實現而異。
在初始連接時,每個流會話都會嘗試保留 10 分鐘的積分。如果客戶端沒有 10 分鐘的積分可以保留,則 WebSocket 將返回關閉消息。每當超過 5 分鐘的實時時間(流
持續時間)過去時,Rev AI 就會嘗試保留另外 5 分鐘的積分。同樣,如果客戶端的配額用完,則 WebSocket 連接將關閉并顯示關閉消息。建議啟用自動重新加載,以防止
積分在中途用完。
關閉連接后,音頻持續時間和流持續時間將最終確定。任何未使用的積分都將取消保留。任何暫時擱置的額外積分都將退還給客戶,并可用于其他轉錄工作。您將為兩者
中較大的一個付費,至少需要 15 秒。


開始使用
這個簡短的教程將教您向 Rev AI API 發出請求的基礎知識。本教程使用異步語音轉文本 API 生成你提交的音頻文件的腳本。
假設
本教程假定您有一個 Rev AI 帳戶。如果沒有,請注冊一個免費帳戶。
第 1 步:獲取訪問令牌
第一步是生成訪問令牌,該令牌將允許訪問 Rev AI API。請按照下列步驟操作:
- 登錄 Rev AI。
2.導航到“訪問令牌”頁面。
3.單擊“生成新的訪問令牌”鏈接。在彈出的對話框中確認操作。
將生成新的訪問令牌并顯示在屏幕上。
警告
將您的訪問令牌保存在安全的地方;您只能看到它們一次。一次最多允許 2 個訪問令牌。
第 2 步:提交文件進行轉錄
使用以下命令將音頻文件提交到 Rev AI 進行轉錄。將占位符替換為在步驟 1 中獲取的訪問令牌,并根據需要將下面顯示的示例文件 URL 替換為您自己的音頻文件的 URL。
curl -X POST "https://api.rev.ai/speechtotext/v1/jobs" \
-H "Authorization: Bearer <REVAI_ACCESS_TOKEN>" \
-H "Content-Type: application/json" \
-d '{"source_config": {"url": "https://www.rev.ai/FTC_Sample_1.mp3"},"metadata":"This is a test"}'
您將收到如下回復:
{
"id": "Umx5c6F7pH7r",
"created_on": "2021-09-15T05:14:38.13",
"name": "FTC_Sample_1.mp3",
"metadata": "This is a test",
"status": "in_progress",
"type": "async",
"language": "en"
}
(在本例中)將使您能夠檢索您的成績單。
第 3 步:檢索成績單
您現在需要等待作業完成。等待大約 1 分鐘,然后通過查詢 API 檢查作業,如下所示:
curl -X GET https://api.rev.ai/speechtotext/v1/jobs/<ID> \
-H "Authorization: Bearer <REVAI_ACCESS_TOKEN>"
警告
不建議在生產服務器中定期輪詢 API 以獲取作業狀態。相反,在聽錄作業完成后,使用 Webhook 異步接收通知。
一旦聽錄作業更改為 ,您可以通過運行以下命令以 JSON 格式檢索腳本。如前所述,將占位符替換為在步驟 1 中獲取的訪問令牌。還必須將占位符替換為在步驟 2 中獲得的占位符。
curl -X GET "https://api.rev.ai/speechtotext/v1/jobs/<ID>/transcript" \
-H "Authorization: Bearer <REVAI_ACCESS_TOKEN>" \
-H "Accept: application/vnd.rev.transcript.v1.0+json"
下面是輸出的示例:
{
"monologues": [
{
"speaker": 1,
"elements": [
{
"type": "text",
"value": "Hi",
"ts": 0.27,
"end_ts": 0.32,
"confidence": 1
},
{
"type": "punct",
"value": ","
},
{
"type": "punct",
"value": " "
},
{
"type": "text",
"value": "my",
"ts": 0.35,
"end_ts": 0.46,
"confidence": 1
},
{
"type": "punct",
"value": " "
},
{
"type": "text",
"value": "name's",
"ts": 0.47,
"end_ts": 0.59,
"confidence": 1
},
{
...
}
]
},
{
...
}
]
}
或者,您可以通過運行以下命令來獲取明文版本:
curl -X GET "https://api.rev.ai/speechtotext/v1/jobs/<ID>/transcript" \
-H "Authorization: Bearer <REVAI_ACCESS_TOKEN>" \
-H "Accept: text/plain"
后續步驟
您現在應該對如何使用 Rev AI API 有一個基本的想法。要了解更多信息,請閱讀 API 文檔,了解有關可用不同 API 及其功能的完整詳細信息。您還可以找到代碼示例和 SDK 文檔,以幫助您將應用程序與 API 連接起來。




透明靈活的定價,助您成長
適用于音頻和視頻應用程序的語音轉文本 API
流持續時間和音頻持續時間:
流持續時間是指自 WebSocket 連接建立以來經過的實際秒數。音頻持續時間是指通過 WebSocket 連接發送的音頻的秒數。 對于大多數用例,這兩者不會有顯著差異,
作為用戶,它們的差異可以忽略不計。但我們在這里單獨引用它們,因為它們可能因您的實現而異。
在初始連接時,每個流會話都會嘗試保留 10 分鐘的積分。如果客戶端沒有 10 分鐘的積分可以保留,則 WebSocket 將返回關閉消息。每當超過 5 分鐘的實時時間(流
持續時間)過去時,Rev AI 就會嘗試保留另外 5 分鐘的積分。同樣,如果客戶端的配額用完,則 WebSocket 連接將關閉并顯示關閉消息。建議啟用自動重新加載,以防止
積分在中途用完。
關閉連接后,音頻持續時間和流持續時間將最終確定。任何未使用的積分都將取消保留。任何暫時擱置的額外積分都將退還給客戶,并可用于其他轉錄工作。您將為兩者
中較大的一個付費,至少需要 15 秒。


開始使用
這個簡短的教程將教您向 Rev AI API 發出請求的基礎知識。本教程使用異步語音轉文本 API 生成你提交的音頻文件的腳本。
假設
本教程假定您有一個 Rev AI 帳戶。如果沒有,請注冊一個免費帳戶。
第 1 步:獲取訪問令牌
第一步是生成訪問令牌,該令牌將允許訪問 Rev AI API。請按照下列步驟操作:
- 登錄 Rev AI。
2.導航到“訪問令牌”頁面。
3.單擊“生成新的訪問令牌”鏈接。在彈出的對話框中確認操作。
將生成新的訪問令牌并顯示在屏幕上。
警告
將您的訪問令牌保存在安全的地方;您只能看到它們一次。一次最多允許 2 個訪問令牌。
第 2 步:提交文件進行轉錄
使用以下命令將音頻文件提交到 Rev AI 進行轉錄。將占位符替換為在步驟 1 中獲取的訪問令牌,并根據需要將下面顯示的示例文件 URL 替換為您自己的音頻文件的 URL。
curl -X POST "https://api.rev.ai/speechtotext/v1/jobs" \
-H "Authorization: Bearer <REVAI_ACCESS_TOKEN>" \
-H "Content-Type: application/json" \
-d '{"source_config": {"url": "https://www.rev.ai/FTC_Sample_1.mp3"},"metadata":"This is a test"}'
您將收到如下回復:
{
"id": "Umx5c6F7pH7r",
"created_on": "2021-09-15T05:14:38.13",
"name": "FTC_Sample_1.mp3",
"metadata": "This is a test",
"status": "in_progress",
"type": "async",
"language": "en"
}
(在本例中)將使您能夠檢索您的成績單。
第 3 步:檢索成績單
您現在需要等待作業完成。等待大約 1 分鐘,然后通過查詢 API 檢查作業,如下所示:
curl -X GET https://api.rev.ai/speechtotext/v1/jobs/<ID> \
-H "Authorization: Bearer <REVAI_ACCESS_TOKEN>"
警告
不建議在生產服務器中定期輪詢 API 以獲取作業狀態。相反,在聽錄作業完成后,使用 Webhook 異步接收通知。
一旦聽錄作業更改為 ,您可以通過運行以下命令以 JSON 格式檢索腳本。如前所述,將占位符替換為在步驟 1 中獲取的訪問令牌。還必須將占位符替換為在步驟 2 中獲得的占位符。
curl -X GET "https://api.rev.ai/speechtotext/v1/jobs/<ID>/transcript" \
-H "Authorization: Bearer <REVAI_ACCESS_TOKEN>" \
-H "Accept: application/vnd.rev.transcript.v1.0+json"
下面是輸出的示例:
{
"monologues": [
{
"speaker": 1,
"elements": [
{
"type": "text",
"value": "Hi",
"ts": 0.27,
"end_ts": 0.32,
"confidence": 1
},
{
"type": "punct",
"value": ","
},
{
"type": "punct",
"value": " "
},
{
"type": "text",
"value": "my",
"ts": 0.35,
"end_ts": 0.46,
"confidence": 1
},
{
"type": "punct",
"value": " "
},
{
"type": "text",
"value": "name's",
"ts": 0.47,
"end_ts": 0.59,
"confidence": 1
},
{
...
}
]
},
{
...
}
]
}
或者,您可以通過運行以下命令來獲取明文版本:
curl -X GET "https://api.rev.ai/speechtotext/v1/jobs/<ID>/transcript" \
-H "Authorization: Bearer <REVAI_ACCESS_TOKEN>" \
-H "Accept: text/plain"
后續步驟
您現在應該對如何使用 Rev AI API 有一個基本的想法。要了解更多信息,請閱讀 API 文檔,了解有關可用不同 API 及其功能的完整詳細信息。您還可以找到代碼示例和 SDK 文檔,以幫助您將應用程序與 API 連接起來。



