上圖是端對端的深度學(xué)習(xí)訓(xùn)練和推理過程。對比傳統(tǒng)聲紋識別模型,我們的模型在實(shí)際使用中優(yōu)勢明顯,在用戶遠(yuǎn)程身份驗(yàn)證場景,通過注冊用戶說一段話,即可輕松快速的確認(rèn)注冊用戶身份,識別準(zhǔn)確率達(dá)到95%以上,秒級響應(yīng),實(shí)時(shí)聲紋核身。下面簡要介紹我們模型的特點(diǎn)。

2.0 度量學(xué)習(xí)

實(shí)驗(yàn)發(fā)現(xiàn),在聲紋識別中采用softmax進(jìn)行網(wǎng)絡(luò)訓(xùn)練 ,用余弦相似度的測試性能往往不如傳統(tǒng)聲紋識別模型,尤其是在魯棒性上。分析發(fā)現(xiàn)[6]基于softmax的分類訓(xùn)練,為了得到更小的loss,優(yōu)化器會(huì)增大一些easy samples的L2 length,減小hard examples 的L2 length,導(dǎo)致這些樣本并沒有充分學(xué)習(xí),特征呈現(xiàn)放射狀,以MNIST識別任務(wù)為例,基于softmax學(xué)到的特征分布如圖3(a)所示. 同類別特征分布并不聚攏,在L2 長度上拉長,呈放射狀,且每個(gè)類別的間距并不大,在verification的任務(wù)中,會(huì)導(dǎo)致相鄰的兩個(gè)類別得分很高。

為了達(dá)到類內(nèi)聚攏,類間分散的效果,我們研究了在圖像領(lǐng)域中應(yīng)用較為成功的幾種softmax變種,包括AM-softmax[4],arcsoftmax[5]等,從圖3(b)可以看到,基于margin的softmax,相比純softmax,類間的分散程度更大,且類內(nèi)特征更聚攏,對聲紋1:1比對和1:N搜索的任務(wù)友好。

2.1 噪音魯棒性

在特征提取時(shí),對于簡單加性噪音,我們提出了基于功率譜減法,實(shí)現(xiàn)噪音抑制;對于其他復(fù)雜噪音,我們提出了基于降噪自動(dòng)編碼器的噪音補(bǔ)償模型,將帶噪語音特征映射到干凈語音特征,實(shí)現(xiàn)噪音消除。

在模型訓(xùn)練時(shí),我們采用數(shù)據(jù)增強(qiáng)的訓(xùn)練機(jī)制,將噪音數(shù)據(jù)通過隨機(jī)高斯的形式加入到聲紋模型的訓(xùn)練中,使得訓(xùn)練后的模型對噪音數(shù)據(jù)具有更好的魯棒性。

2.2 短音頻魯棒性

為了提高短音頻魯棒性,我們提出了基于短時(shí)幀級別的模型訓(xùn)練機(jī)制,使模型能夠在極短的語音時(shí)長(約0.5秒)下即可完成聲紋識別. 在此基礎(chǔ)上,我們在模型訓(xùn)練中引入了更多高階的音頻統(tǒng)計(jì)信息和正則化方法,進(jìn)一步提升了模型在短語音條件下(2~3秒)的識別精度。

03如何使用AnalyticDB搭建聲紋對比系統(tǒng)

3.0 創(chuàng)建插件

使用一下SQL來分別創(chuàng)建AnalyticDB的非結(jié)構(gòu)化分析插件OpenAnalytic和向量檢索插件fastann。

CREATE EXTENSION IF NOT EXISTS open_analytic;
CREATE EXTENSION IF NOT EXISTS fastann;

注:*左右滑動(dòng)閱覽

3.1 建表

我們可以建立一個(gè)表來保存所有說話人的聲音和聲音的特征,后續(xù)我們可以從這個(gè)表中搜索說話人。

CREATE TABLE speaker_table (
speaker_id TEXT NOT NULL, # 說話人id
audio BYTEA NOT NULL, # 聲音文件
feature REAL[] NOT NULL, # 聲音特征向量
PRIMARY KEY (question)
);

注:*左右滑動(dòng)閱覽

3.2 創(chuàng)建索引

我們可以為特征向量列創(chuàng)建向量檢索索引。

CREATE INDEX speaker_table_index 
ON speaker_table USING ann (feature) WITH (dim = 512);

注:*左右滑動(dòng)閱覽

3.3 創(chuàng)建聲紋識別算法pipeline

通過以下sql,我們可以在數(shù)據(jù)庫中創(chuàng)建聲紋特征提取的算法模型。

SELECT open_analytic.pipeline_create('speaker_feature_extractor');

注:*左右滑動(dòng)閱覽

3.4 獲取說話人聲紋特征

通過以下sql可以使用3.3創(chuàng)建的pipeline。這個(gè)UDF的輸入是pipeline名稱和目標(biāo)文本。輸出是一個(gè)說話人聲音的特征向量。

# 通過聲音文件識別
SELECT open_analytic.pipeline_run_dist_random('speaker_feature_extractor',
<聲音文件>);

注:*左右滑動(dòng)閱覽

3.5 說話人聲紋特征導(dǎo)入AnalyticDB

獲取聲音特征后, 我們可以使用一下sql來講數(shù)據(jù)插入3.1創(chuàng)建的表中。

INSERT INTO speaker_table VALUES (<說話人id>,  <聲音文件>, <聲音特征向量>);

注:*左右滑動(dòng)閱覽

3.6 在數(shù)據(jù)庫中搜索最相似的的人

通過以下sql,我們可以在聲音特征庫中搜索最相似的說話人。然后我們可以根據(jù)特征間距離是否滿足預(yù)設(shè)的閾值來判斷是否是同一個(gè)人。

SELECT speaker_id, l2_distance(feature,  <聲音特征向量>) 
ORDER BY feature <-> <聲音特征向量>
LIMIT 10;

注:*左右滑動(dòng)閱覽

3.7 比較兩個(gè)聲音是否為同一個(gè)人

我們還可以提取出兩個(gè)人的聲音特征然后直接計(jì)算二者的距離來判斷這兩個(gè)聲音是否來自同一個(gè)說話人。SQL如下

SELECT  l2_distance(feature1,  feature2);

注:*左右滑動(dòng)閱覽

04AnalyticDB介紹

分析型數(shù)據(jù)庫(AnalyticDB)是阿里云上的一種高并發(fā)低延時(shí)的PB級實(shí)時(shí)數(shù)據(jù)倉庫,可以毫秒級針對萬億級數(shù)據(jù)進(jìn)行即時(shí)的多維分析透視和業(yè)務(wù)探索。AnalyticDB for MySQL 全面兼容MySQL協(xié)議以及SQL:2003 語法標(biāo)準(zhǔn), AnalyticDB forPostgreSQL 支持標(biāo)準(zhǔn) SQL:2003,高度兼容 Oracle 語法生態(tài)。

向量檢索和非結(jié)構(gòu)化數(shù)據(jù)分析是AnalyticDB的進(jìn)階功能。目前兩款產(chǎn)品都包含向量檢索功能, 可以支持人臉, 人體, 車輛等的相似查詢和推薦系統(tǒng)。AnalyticDB在真實(shí)應(yīng)用場景中可以支持10億級別的向量數(shù)據(jù)的查詢, 毫秒級別的響應(yīng)時(shí)間。AnalyticDB已經(jīng)在多個(gè)城市的重大項(xiàng)目中大規(guī)模部署。

在一般的包含向量檢索的的應(yīng)用系統(tǒng)中, 通常開發(fā)者會(huì)使用向量檢索引擎(例如Faiss)來存儲(chǔ)向量數(shù)據(jù), 然后使用關(guān)系型數(shù)據(jù)庫存儲(chǔ)結(jié)構(gòu)化數(shù)據(jù)。在查詢時(shí)也需要交替查詢兩個(gè)系統(tǒng), 這種方案會(huì)有額外的開發(fā)工作并且性能也不是最優(yōu)。AnalyticDB支持結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)(向量)的檢索,僅僅使用SQL接口就可以快速的搭建起以圖搜圖或者圖片+結(jié)構(gòu)化數(shù)據(jù)混合檢索等功能。AnalyticDB的優(yōu)化器在混合檢索場景中會(huì)根據(jù)數(shù)據(jù)的分布和查詢的條件選擇最優(yōu)的執(zhí)行計(jì)劃,在保證召回的同時(shí),得到最優(yōu)的性能。AnalyticDB向量版采用了多項(xiàng)創(chuàng)新性技術(shù), 這些技術(shù)在我們的論文?AnalyticDB-V: A Hybrid Analytical Engine Towards Query Fusion for Structured and Unstructured Data?中有詳細(xì)介紹介紹。目前論文已經(jīng)被數(shù)據(jù)庫三大頂會(huì)之一的VLDB接受, 具有技術(shù)領(lǐng)先性。

結(jié)構(gòu)化信息+非結(jié)構(gòu)化信息(圖片)混合檢索在實(shí)際應(yīng)用中被廣泛使用的。例如人臉門禁系統(tǒng)被部署在多個(gè)小區(qū)時(shí), 我們使用一張表存儲(chǔ)了所有小區(qū)的人臉特征, 在人臉檢索時(shí)我們只需要檢索當(dāng)前小區(qū)的人臉特征。在這種情況下, 使用AnalyticDB我們只需要在SQL中增加where 小區(qū)名 =’xxx’ 就可以輕易實(shí)現(xiàn)。AnalyticDB同時(shí)提供了先進(jìn)的圖像文本分析算法, 能夠提取非結(jié)構(gòu)化數(shù)據(jù)的特征和標(biāo)簽, 用戶僅僅需要使用SQL就可以完成圖像文本內(nèi)容的分析。

本文章轉(zhuǎn)載微信公眾號@阿里云瑤池?cái)?shù)據(jù)庫

熱門推薦
一個(gè)賬號試用1000+ API
助力AI無縫鏈接物理世界 · 無需多次注冊
3000+提示詞助力AI大模型
和專業(yè)工程師共享工作效率翻倍的秘密
返回頂部
上一篇
LangChain-Chatchat:基于LangChain和ChatGLM2-6B構(gòu)建本地離線私有化知識庫
下一篇
bentoml:把你的機(jī)器學(xué)習(xí)模型變成專業(yè)級API服務(wù)!
国内精品久久久久影院日本,日本中文字幕视频,99久久精品99999久久,又粗又大又黄又硬又爽毛片
蜜臀精品久久久久久蜜臀| 亚洲一区二区三区中文字幕 | 成人黄色大片在线观看| www.在线成人| 欧美一区二区性放荡片| 久久综合久色欧美综合狠狠| 国产精品不卡在线观看| 亚洲第一狼人社区| 懂色av中文字幕一区二区三区| 色噜噜夜夜夜综合网| 欧美一级艳片视频免费观看| 国产精品久久久久久久久快鸭| 视频一区视频二区中文| 91丨九色丨国产丨porny| 欧美成人一区二区三区| 伊人色综合久久天天| 国产精品 日产精品 欧美精品| 欧美在线观看一区二区| **网站欧美大片在线观看| 国产经典欧美精品| 国产清纯在线一区二区www| 裸体一区二区三区| 欧美人妖巨大在线| 亚洲国产精品尤物yw在线观看| 另类小说欧美激情| 欧美一区二区三区思思人| 亚洲激情五月婷婷| 99国内精品久久| 一区二区三区欧美| 欧美丰满一区二区免费视频| 亚洲成人资源在线| 欧美人妇做爰xxxⅹ性高电影| 夜夜精品视频一区二区| 欧美色视频在线| 蜜臀av性久久久久蜜臀aⅴ流畅| 欧美高清精品3d| 国内外精品视频| 亚洲欧洲精品一区二区精品久久久 | 欧美精品99久久久**| 乱一区二区av| 国产精品嫩草99a| 91伊人久久大香线蕉| 亚洲成人在线免费| 久久亚洲一级片| 91丝袜呻吟高潮美腿白嫩在线观看| 亚洲va欧美va人人爽午夜| 亚洲精品在线观看视频| www.色综合.com| 精东粉嫩av免费一区二区三区| 欧美国产日本视频| 91精品国模一区二区三区| 波多野结衣精品在线| 亚洲成人动漫在线免费观看| 久久综合丝袜日本网| 欧美制服丝袜第一页| 处破女av一区二区| 久久精品噜噜噜成人88aⅴ| 亚洲人成精品久久久久久| 久久久久九九视频| 日韩欧美国产麻豆| 欧美午夜电影网| 91免费观看视频在线| 狠狠狠色丁香婷婷综合激情 | 亚洲三级在线免费观看| 欧美xxxxxxxxx| 91精品国产综合久久精品性色| 色噜噜狠狠成人中文综合| 国精品**一区二区三区在线蜜桃| 人人狠狠综合久久亚洲| 亚洲网友自拍偷拍| 亚洲专区一二三| 成人aa视频在线观看| 懂色av一区二区三区免费看| 精品一区二区三区免费视频| 美女网站在线免费欧美精品| 日韩高清欧美激情| 五月激情六月综合| 日韩av一二三| 韩国欧美国产1区| 成人深夜福利app| 久久精品久久精品| 视频一区二区不卡| 亚洲一区二区三区中文字幕在线 | 91国偷自产一区二区三区观看| 在线观看亚洲专区| 欧美一级理论性理论a| 久久久国产午夜精品 | 欧美刺激午夜性久久久久久久| 精品播放一区二区| 亚洲欧洲日产国码二区| 亚洲一区二区高清| 国产成人精品影院| 欧美精品乱人伦久久久久久| 91亚洲大成网污www| 日韩一本二本av| 中文字幕在线不卡视频| 久久狠狠亚洲综合| 欧洲精品一区二区| 国产精品看片你懂得| 午夜精品影院在线观看| 99久久精品免费看国产免费软件| 91精品国产麻豆国产自产在线| 成人免费在线视频| 成人晚上爱看视频| 国产蜜臀av在线一区二区三区| 首页国产欧美久久| 91麻豆成人久久精品二区三区| 中文字幕第一区| 国产激情一区二区三区| 久久亚洲精品国产精品紫薇| 久久国内精品视频| 91精品久久久久久久99蜜桃| 三级欧美在线一区| 日韩欧美在线观看一区二区三区| 五月婷婷另类国产| 91精品国产一区二区| 麻豆91免费看| 2022国产精品视频| 国产福利一区在线| 国产精品久久久久久一区二区三区 | 久久精品国产亚洲一区二区三区| 日韩久久精品一区| 成人精品国产福利| 欧美成人在线直播| 成人国产精品免费观看视频| 18成人在线观看| 欧美一区二区网站| 成人国产在线观看| 调教+趴+乳夹+国产+精品| 久久免费午夜影院| 欧美喷水一区二区| 国产精品伊人色| 三级影片在线观看欧美日韩一区二区| 色婷婷久久久亚洲一区二区三区| 国产 日韩 欧美大片| 国产精品成人一区二区三区夜夜夜 | 青青草原综合久久大伊人精品 | 日韩亚洲欧美一区| 日韩一区二区视频在线观看| 亚洲综合激情小说| 成人看片黄a免费看在线| 欧美视频在线一区| 亚洲欧美日韩中文播放| 婷婷综合另类小说色区| www.亚洲色图| 国产精品乱码一区二区三区软件| 亚洲成av人片| 91天堂素人约啪| 欧美一级生活片| 欧美偷拍一区二区| 日韩精品乱码av一区二区| 欧美日韩国产不卡| 亚洲国产乱码最新视频| 欧美日韩视频第一区| 中文字幕日本不卡| 成人app下载| 五月婷婷色综合| 91美女片黄在线观看| 一卡二卡三卡日韩欧美| 国产露脸91国语对白| 国产精品乱子久久久久| 91色乱码一区二区三区| 午夜欧美在线一二页| 欧美国产日韩a欧美在线观看| 波多野结衣91| 久久精子c满五个校花| 国产精品一线二线三线精华| 99精品久久只有精品| 日韩在线一二三区| 久久先锋影音av鲁色资源网| 日本女优在线视频一区二区| 日韩欧美在线综合网| 91精品在线免费观看| 99re这里都是精品| 高清不卡在线观看| 成人精品免费网站| 成人激情视频网站| 夜夜嗨av一区二区三区网页| 国产精品久久久久久久久久免费看| 久久久久久免费网| 欧美一级艳片视频免费观看| 欧美妇女性影城| 欧美日韩一区二区三区视频| 国产精品你懂的在线欣赏| 亚洲成人免费av| 成人av资源站| 久久女同精品一区二区| 亚洲电影一区二区三区| 高清国产一区二区三区| 久久综合丝袜日本网| 久草精品在线观看| 欧美电影精品一区二区| 久久99国产精品久久99果冻传媒| 久久丝袜美腿综合| 伊人婷婷欧美激情| 国产一区不卡在线| 色婷婷综合久久| 中文字幕一区二区三区在线不卡| 污片在线观看一区二区| 久久蜜臀精品av|