
使用NestJS和Prisma構建REST API:身份驗證
1.提交文件進行轉錄
使用下面的命令提交一個音頻文件給Rev AI進行轉錄。用第1步中獲得的訪問令牌替換<REVAI_ACCESS_TOKEN>
占位符,如果需要,用您自己的音頻文件的URL替換下面顯示的示例文件URL。
curl -X POST "https://api.rev.ai/speechtotext/v1/jobs" \
-H "Authorization: Bearer <REVAI_ACCESS_TOKEN>" \
-H "Content-Type: application/json" \
-d '{"source_config": {"url": "https://www.rev.ai/FTC_Sample_1.mp3"},"metadata":"This is a test"}'
你會收到這樣的回復:
{
"id": "Umx5c6F7pH7r",
"created_on": "2021-09-15T05:14:38.13",
"name": "FTC_Sample_1.mp3",
"metadata": "This is a test",
"status": "in_progress",
"type": "async",
"language": "en"
}
id
(在這種情況下Umx5c6F7pH7r
)將使您能夠檢索您的成績單。
2.修改成績單
您現在需要等待作業完成。等待大約1分鐘,然后通過查詢API檢查作業的status
,如下所示:
curl -X GET https://api.rev.ai/speechtotext/v1/jobs/<ID> \
-H "Authorization: Bearer <REVAI_ACCESS_TOKEN>"
一旦轉錄作業的status
更改為transcribed
,您可以通過運行以下命令以JSON格式檢索轉錄。和前面一樣,用步驟1中獲得的訪問令牌替換<REVAI_ACCESS_TOKEN>
占位符。您還必須將<ID>
占位符替換為步驟2中獲得的id
占位符。
curl -X GET "https://api.rev.ai/speechtotext/v1/jobs/<ID>/transcript" \
-H "Authorization: Bearer <REVAI_ACCESS_TOKEN>" \
-H "Accept: application/vnd.rev.transcript.v1.0+json"
下面是輸出的一個例子:
{
"monologues": [
{
"speaker": 1,
"elements": [
{
"type": "text",
"value": "Hi",
"ts": 0.27,
"end_ts": 0.32,
"confidence": 1
},
{
"type": "punct",
"value": ","
},
{
"type": "punct",
"value": " "
},
{
"type": "text",
"value": "my",
"ts": 0.35,
"end_ts": 0.46,
"confidence": 1
},
{
"type": "punct",
"value": " "
},
{
"type": "text",
"value": "name's",
"ts": 0.47,
"end_ts": 0.59,
"confidence": 1
},
{
...
}
]
},
{
...
}
]
}
或者,您可以通過運行以下命令來獲取純文本版本:
curl -X GET "https://api.rev.ai/speechtotext/v1/jobs/<ID>/transcript" \
-H "Authorization: Bearer <REVAI_ACCESS_TOKEN>" \
-H "Accept: text/plain"
Q:如何找到revai API開放平臺
A:冪簡集成是國內領先的API集成管理平臺,專注于為開發者提供全面、高效、易用的API集成解決方案。冪簡API平臺可以通過以下兩種方式找到所需API:通過關鍵詞搜索API(例如,輸入’revai API開放平臺‘這類品類詞,更容易找到結果)、或者從API hub分類頁進入尋找。
Q:Rev AI支持哪些語言?
A:Rev AI在異步語音轉文本API中支持58種以上語言,在流語音轉文本API中支持9種以上語言。新的語言經常被添加。請參閱當前支持的語言列表。
Q:在文字記錄中,長時間的停頓是如何表現的?
A:這取決于確切的停頓長度,但通常情況下,長時間的停頓會導致文字稿在講話恢復時開始一個新的段落。停頓由其周圍單詞上的時間戳指示。在停頓周圍的單詞上會有一個時間戳的跳躍。
以下默認限制適用于異步語音轉文本API的每個用戶和每個端點:
multipart/form-data
請求提交到/jobs
端點的文件上傳的并發限制為5,每個請求的文件大小限制為2 GB。source_config
job參數上傳的文件大小限制為5 TB。這些限值可通過版本AI支持進行調整。
Q:Rev AI支持什么類型的媒體文件?
A:Rev AI使用FFmpeg,因此支持FFmpeg支持的所有文件格式。這包括所有常見的媒體格式,如MP3,MP4,Ogg,WAV,PCM和FLAC等等。
Q:允許的最大文件大小和音頻持續時間是多少?
A:
允許的最大文件大小取決于提交方法。如果將本地文件從主機作為multipart/form-data
請求,每個請求的文件大小限制為2 GB。如果通過Rev AI儀表板上傳本地文件或通過source_config
作業參數,則文件大小限制為5 TB。
允許的最大音頻長度為17小時。對于超過17小時的音頻,有必要將音頻文件拆分為小于17小時的塊并單獨轉錄。
除了revai API開放平臺,還有其他替代服務商也提供類似api服務,例如:
PingMe API開放平臺、twinpush API開放平臺、AssemblyAI API開放平臺
更多競品可以在冪簡集成開放平臺中找到。
Q:revai API開放平臺這個密鑰還適用于哪些api?
異步語音轉文本API、流式語音轉文本API、自定義詞匯API
本文全面且細致地介紹了如何獲取Revai API開放平臺密鑰的分步指南,為開發者們提供了一份條理清晰、操作簡便的實用手冊。從Revai API平臺的賬號注冊開始,到完成開發者身份認證,再到最終成功獲取密鑰,每一步操作都配以詳盡的說明與指導,確保開發者能夠輕松、準確地完成整個流程。獲取密鑰只是利用Revai API的第一步,如何高效、穩定地集成并應用其強大的語音識別、文本分析等功能才是關鍵。因此,在本文中,我們不僅指導了如何獲取密鑰,還隱含地強調了獲取后進行初步測試與驗證的重要性。通過測試,開發者可以確保Revai API能夠順利集成到應用中,并發揮出最佳效果,從而助力提升應用的性能和用戶體驗。本文為開發者們提供了一個全面、詳盡且極具實用性的操作指南,幫助他們順利獲取Revai API開放平臺的密鑰,并將這一強大的AI服務能力高效地集成到應用中。我們相信,隨著開發者們對這一指南的深入理解和實踐,將能夠在語音識別、文本分析等領域取得更加顯著的成果,為應用的智能化發展注入新的動力。