欧美日韩国产成人_日韩网站在线观看_国产精品sss_国内自拍亚洲

登錄注冊
新聞 資訊 金融 知識 財經 理財 科技 金融 經濟 產品 系統 連接 科技 聚焦
首頁 > 新聞 > 創業創新 > > 正文

Daniel Povey發布新一代框架Kaldi:兼容PyTorch,提高識別精度

2021-09-02 15:01:17來源:雷鋒網

8 月 31 日,Daniel Povey 以小米集團首席語音科學家的身份,正式推出了新一代 Kaldi。

Daniel Povey 是語音識別領域的執牛耳者,他主要開發和維護的開源工具 Kaldi,是業界公認的語音識別框架的基石,他也被稱為 Kaldi 之父。

2019 年 Daniel 離任約翰霍普金斯大學語言和語音處理中心教職,在 Facebook、美團、滴滴、快手等一眾互聯網巨頭拋來的橄欖枝中選擇了小米,開始帶領小米語音技術團隊開發新一代 Kaldi。

加入小米后,業界開發者對 Daniel 的研究動向一直高度關注。

昨日 Daniel 亮相發布會現場,宣布新一代 Kaldi 完成了所有子項目的布局。他表示,“新一代 Kaldi 的目標不僅僅是趕上或者稍微領先現有語音識別庫,而是要從根本上改變語音識別的實現方式。”

據悉,經過近一年多的技術研發,Daniel 團隊完成了所有模塊的研發和更新,新一代 Kaldi 在 Librispeech 數據集上的詞錯率降到了 2.57%;通過全新代碼庫解決了 Kaldi 靈活性不足、體量過大等問題;作為核心部件的 k2,不僅可以用來做語音識別,也可以用來做手寫文字識別等其他任務。

兼容 PyTorch,提高識別精度

Kaldi 集成了多種語音識別模型,包括隱馬爾可夫和最新的深度學習神經網絡,自 2011 年發布以來下載量超過了兩萬多次。無論是工業界還是學術界,幾乎所有的語音團隊都在使用 Kaldi 引擎來開發智能解決方案,包括 MIT、哈佛、清華、微軟、谷歌、Facebook 等等。

作為語音識別領域的“老前輩”,Kaldi 也急需更新迭代。

Daniel 在媒體見面會上坦言,初版 Kaldi 的舊代碼庫已經難以滿足機器學習發展的需求,用戶需要更輕便、更靈活的源代碼,也需要兼容 PyTorch 等主流框架的工具包。

新一代 Kaldi 的研發工作從 2019 開始啟動,去年已經完成了 k2 和 Lhotse 模塊的研發工作。Daniel 還在 2020 MIDC 大會上進行了展示,不過當時 Icefall 模塊還只是一個初步概念。今年研發團隊進一步完善了 k2 和 Lhotse 模塊, 并基于二者正式發布 Icefall 項目。

Daniel 介紹說,與初代 Kaldi 相比,新一代 Kaldi 是一個全新的代碼庫,主要是由 C++、CUDA 寫就;支持 Python 調用;后端也由 PyTorch 取代了此前的自定義代碼。

發布會現場,Daniel 團隊不僅展示了如何使用 k2 和 Lhotse 來實現現有的各種不同的語音識別模型,如基于 Transformer/Conformer 的 CTC 和 LF-MMI 等,更著重展示了 k2 何以能從根本上改變人們實現語音識別的方式。

“我們實現了多輪解碼 (mutiple pass decoding) 的示例,以及我們稱之為‘雙向建模’(bidirectional modeling) 的模型”。Daniel 興奮地表示,基于這種多層模型的優勢,新一代 Kaldi 可以大大提高語音識別模型的建模能力,從而降低詞錯誤率。目前,新一代 Kaldi 在 LibriSpeech 數據集上的詞錯誤率為 2.57%。

值得一提的是,Daniel 團隊在 k2 中實現了所有的 FSA 操作的可導性,用戶僅使用幾十行代碼就可以完成復雜的多層模型結構。同時,他們還為用戶提供了極大的“自定義”空間,諸如在網絡中加入 phone 的 embedding 信息,支持帶置信度的識別等用戶自己的各種想法都能夠基于 k2 來實現。

Daniel 表示,希望通過新一代 Kaldi,能為語音識別領域打開一扇嶄新的大門。

引入 Python,改善靈活性

新一代 Kaldi 分為 Lhotse、Icefall 和 k2 三個部分,Daniel Povey 博士在發布會上表示,新一代 Kaldi 的獨立設計是為了降低耦合性,方便用戶使用。更重要的是,這樣有助于擴展了組件使用的靈活性。

例如,用作數據準備的 Lhotse,既可以用在 Icefall 項目里,也可以用在任意其他語音識別庫里來處理音頻和文本數據,

Daniel 團隊在發布會上介紹了Lhotse、Icefall 和 k2 三個部分的更新細節。

Lhotse 拋棄了傳統的 shell 腳本,采用了更加方便易用的 Python 語言。通過通用且不失靈活性的接口設計,滿足了包括語音識別,語音合成等多種語音任務的需求,方便用戶基于 Lhotse 可以方便地實現針對自己特定任務的接口,操縱各種不同的音頻元數據和文本。

Lhotse 引入了 Audio Cuts 的概念,將訓練數據自動地組織為一組組 Cuts,并基于這種表示,提供了 on-the-fly 的數據混合,裁剪,增強和特征提取等操作,從而在不影響數據處理效率的前提下,降低了數據存儲所需空間。

此外,Lhotse 還提供了很多公開數據集的數據處理腳本,用戶可以直接使用這些腳本,來進行相關語音任務的數據處理工作,大大降低了用戶在某個數據集上進行實驗的前期成本。

“相信在不久的將來,隨著新一代 Kaldi 的推廣和普及,Lhotse 甚至有可能成為語音領域使用最為廣泛的數據準備工具。”Daniel 期待地表示。

作為訓練腳本的集合,同 Lhotse 一樣,Icefall 也是一個純 Python 項目。

用過 Kaldi 的人都知道,Kaldi 里有大量的基于不同數據集的示例腳本,顯著降低了用戶的學習成本。

但這同時也帶來一個缺點:示例腳本集合太過龐大,代碼耦合過于緊密,導致維護成本較高。

考慮到這一點,Daniel 表示 Icefall 并不是對大量腳本的盲目集合,而是在提取公共組件的同時將不同數據集的示例腳本進行獨立組織,以方便用戶的學習和使用。

此外,由于將數據準備部分單獨放在 Lhotse 項目中,核心計算部分單獨放在 k2 中,Icefall 項目只需要關注語音識別模型的結構定義部分,降低了整個語音識別過程的耦合性,方便了網絡結構的復用。

k2 是新一代 Kaldi 的核心。它的貢獻在于,將加權有限狀態轉換器 (Weighted Finite State Transducers, WFST) 和相關算法無縫地集成到基于 Autograd 的機器學習工具包中,如 PyTorch(已完成支持)和 TensorFlow。

WFST 是語音識別領域最為核心的數據結構,可以用來構建諸如“音標-> 詞-> 句子”的狀態轉換概率圖。

支持 WFST 可導意味著我們可以做很多以前很難做到,甚至做不到的事情,如消除以往語音識別任務中訓練跟解碼過程不匹配的問題、多輪(可求導)的語音識別過程、在聲學網絡中嵌入任意輔助信息等。

同時,k2 也支持很多現有的語音識別模型,如 CTC、LF-MMI、RNN-T 等。

值得一提的是,去年 Facebook 發布了類似于 k2 的圖網絡建模 GTN 框架。與之相比,k2 實現了更多的 WFST 相關算法,并且能夠高效地支持 GPU(GTN 目前只支持 CPU)。GPU 實現,意味著語音識別模型的訓練速度更快,解碼速度更高效。新一代 kaldi 的解碼速度已經是實時的 300 倍左右。此外,k2 在語音識別的基礎上,還可以應用于手寫文字識別等其他 seq-to-seq 的任務。

新一代 Kaldi 依然開源

“新一代 Kaldi 或將在明年之前將全部應用到小米所有的智能語音產品中”,Daniel 向媒體表示。他說,新一代 Kaldi 能夠適用各種場景的不同語音模型,如遠近場語音喚醒、離在線語音識別、說話人識別等通用模型,以及口語評測、語種識別、語音情緒識別等。

以小米小愛為例,“通過它,用戶可以連接到各種各樣的 AIoT 設備并與它們產生互動: 智能音箱、手機、電視、智能手表、兒童故事機、車載后視鏡等。”

不僅是小米,所有企業、開發者和普通用戶都可以繼續享受新一代 Kaldi 的核心技術。Daniel 表示,當初之選擇加盟小米,也是因為小米承諾 Kaldi 可以繼續作為開源項目。“小米是一家穩定的公司,重視開源開放,而且允諾我一直做開源項目,這對于我來說是最好的選擇”

Kaldi 從誕生之日起,就是一款開源語音識別工具包。Daniel 一直堅持開源工作,鼓勵更廣泛的用戶自由使用、復制以及修改源代碼,并推動智能語音技術的發展。

新一代 Kaldi 依舊采用了高效的 C++ 代碼實現。由于將 k2 的 C++ 代碼都包裝到了 Python, 模型的訓練迭代都可以使用純 Python 代碼完成。

Daniel 表示,基于 Icefall 中的示例腳本,開發者們可以很容易地基于自己公司產品的數據集進行修改,進而快速地搭建線上數據反饋和模型自動迭代更新的流程,這將大大縮短模型更新的周期。

隨著新一代 Kaldi 的發布和其在小米產品線的逐步落地,相信在不久的將來,小米將和其他公司一起,為普通用戶帶來更加完善的 AIoT 產品體驗。

關于 Daniel

Daniel 可以說是語音識別領域的殿堂級人物。除了開發 kaldi 外,他還對語音識別做出了許多科學貢獻,包括助力判別訓練(現在稱為序列訓練)的早期發展等。從 1999 年發布語音識別研究成果以來,其論文被引用次數超過了 30000 次。也因如此,Daniel 從約翰斯?霍普金斯大學離職后,引發了全球科技巨頭的一場人才爭奪戰。

Daniel 在 2012 年加入約翰斯?霍普金斯大學,擔任語言和語音處理中心任副教授。在此之前,他在 IBM 研究院、微軟研究院從事計算機語音識別研究。

2019 年 10 月,Daniel 正式加入小米公司,擔任小米集團首席語音科學家。

關鍵詞: 框架 Kaldi 新一代

熱點
39熱文一周熱點
欧美日韩国产成人_日韩网站在线观看_国产精品sss_国内自拍亚洲
日本 国产 欧美色综合| 婷婷国产在线综合| 亚洲国产精品视频| 99久久免费精品| 国产精品美女视频| 成人激情视频网站| 中文字幕一区在线观看视频| 风间由美中文字幕在线看视频国产欧美| 精品国精品自拍自在线| 高清成人免费视频| 国产精品久线观看视频| 91天堂素人约啪| 亚洲成人免费在线观看| 日韩视频一区二区三区| 久久精品99国产国产精| 国产嫩草影院久久久久| 91高清视频免费看| 青青草国产精品亚洲专区无| 久久蜜臀精品av| 色8久久人人97超碰香蕉987| 日本系列欧美系列| 中文字幕欧美激情一区| 色噜噜狠狠一区二区三区果冻| 亚洲国产精品人人做人人爽| 欧美一卡在线观看| 成人福利电影精品一区二区在线观看| 亚洲美女视频在线观看| 日韩一区二区视频在线观看| 成人午夜电影久久影院| 五月综合激情日本mⅴ| 精品久久国产字幕高潮| 99精品视频在线观看| 免费看欧美美女黄的网站| 久久久久久久久久看片| 色哟哟日韩精品| 九一九一国产精品| 夜夜亚洲天天久久| 中文字幕第一区| 欧美一区二区三区日韩视频| 成人亚洲一区二区一| 性做久久久久久久久| 中文字幕欧美激情| 欧美一区二区在线视频| 91美女精品福利| 国产盗摄女厕一区二区三区| 日韩av一区二区三区四区| 一区二区三区资源| 国产精品久久二区二区| 国产欧美综合在线观看第十页| 在线综合亚洲欧美在线视频| 成人av在线影院| 极品少妇xxxx精品少妇| 午夜精品成人在线视频| 亚洲精品videosex极品| 国产精品久久福利| 国产天堂亚洲国产碰碰| 久久久久九九视频| 久久久久久久久久久久电影| 精品国产一区二区三区忘忧草| 6080国产精品一区二区| 欧美欧美欧美欧美| 精品污污网站免费看| 欧美色综合影院| 91搞黄在线观看| 91久久精品午夜一区二区| av电影在线不卡| 成人精品小蝌蚪| a级精品国产片在线观看| 福利一区二区在线观看| 国产91综合一区在线观看| 国产中文一区二区三区| 老司机一区二区| 韩国v欧美v日本v亚洲v| 国产一区视频网站| 国产做a爰片久久毛片 | 日韩精品一区二区在线| 7799精品视频| 欧美哺乳videos| 精品粉嫩aⅴ一区二区三区四区| 26uuu精品一区二区三区四区在线| 欧美va在线播放| 国产日韩精品一区二区浪潮av| 国产亚洲婷婷免费| 中文字幕亚洲一区二区av在线 | 在线观看三级视频欧美| 在线亚洲人成电影网站色www| 色狠狠一区二区| 91精品国产色综合久久不卡蜜臀| 欧美大黄免费观看| 中文字幕第一区二区| 一个色妞综合视频在线观看| 欧美96一区二区免费视频| 国产精品亚洲第一| 在线精品观看国产| 精品91自产拍在线观看一区| 国产精品视频免费看| 亚洲成人综合视频| 韩国精品一区二区| 97精品超碰一区二区三区| 欧美精选午夜久久久乱码6080| 久久久久久久久久久久久夜| 亚洲美女少妇撒尿| 国产一区二区日韩精品| 色视频欧美一区二区三区| 日韩手机在线导航| 亚洲免费高清视频在线| 国产做a爰片久久毛片| 欧美无砖专区一中文字| 国产色91在线| 日本在线观看不卡视频| 91免费观看国产| 久久精品男人的天堂| 午夜激情综合网| www.欧美精品一二区| 精品国产一区二区精华| 亚洲一区视频在线| 成人污视频在线观看| 精品美女一区二区三区| 午夜一区二区三区在线观看| 成人av免费在线观看| 久久青草国产手机看片福利盒子| 一区二区三区精品| 99久久婷婷国产综合精品| 久久亚洲精品国产精品紫薇| 日本中文在线一区| 欧美三级中文字| 一区二区三区日韩欧美| av电影在线观看不卡| 久久伊99综合婷婷久久伊| 亚洲第一会所有码转帖| 色综合欧美在线视频区| 国产精品国产自产拍高清av | 欧美日产在线观看| 综合色天天鬼久久鬼色| 国产91丝袜在线18| 久久综合色之久久综合| 热久久一区二区| 欧美一区二区在线观看| 亚洲不卡一区二区三区| 欧美日韩久久一区二区| 香港成人在线视频| 欧美精品xxxxbbbb| 奇米综合一区二区三区精品视频| 精品视频在线免费| 丝瓜av网站精品一区二区 | 亚洲女与黑人做爰| 9久草视频在线视频精品| 国产精品人妖ts系列视频| 丁香亚洲综合激情啪啪综合| 国产调教视频一区| 国产精品一级片| 久久久影院官网| 国产成人精品免费一区二区| 久久久午夜电影| 国产精品18久久久久| 久久久99精品免费观看| 国产91高潮流白浆在线麻豆| 国产精品成人在线观看| 在线观看区一区二| 日本不卡在线视频| 久久久亚洲午夜电影| 成人高清视频在线观看| 一区二区成人在线| 日韩一区二区免费在线观看| 国产精品一区三区| 亚洲精品国产无天堂网2021| 欧美日韩久久久| 国内精品伊人久久久久av影院| 久久久不卡网国产精品一区| 99r精品视频| 美女视频第一区二区三区免费观看网站| 26uuu色噜噜精品一区二区| 不卡一区中文字幕| 伊人色综合久久天天| 欧美一级免费大片| 成人午夜激情片| 亚洲五码中文字幕| 精品福利在线导航| 日本韩国视频一区二区| 麻豆91精品视频| 亚洲视频免费看| 日韩精品一区二区三区视频在线观看 | 五月天视频一区| 国产视频在线观看一区二区三区| 色成年激情久久综合| 蜜臂av日日欢夜夜爽一区| 亚洲国产成人自拍| 欧美日韩一区二区三区高清| 国产伦精品一区二区三区免费迷 | 蜜臀av性久久久久蜜臀aⅴ四虎| 国产丝袜在线精品| 7777精品久久久大香线蕉| www.视频一区| 国产乱国产乱300精品| 亚洲成人av在线电影| 国产精品免费久久久久| 亚洲精品在线免费观看视频| 在线一区二区三区四区五区| 国产成人精品免费网站| 日本强好片久久久久久aaa|