AI語音辨識:用Kaldi實作應用全集

NT $ 792


從Hey、Siri、OKGoogle開始,我們早已習慣用語音來控制設備,語音輸入法取代鍵盤,Google幫你朗讀文章,你一定很好奇這些語音系統是如何建造出來的。

本書以Kaldi為主,完整介紹Librispeech等資料處理,並且完整說明了三音素架構。
語音模型方面:完整介紹語言模型、n元模型。
特徵工程方面:完整介紹包括對齊、Transition模型、GMM模型等。
構圖及解碼方面:完整介紹OpenFST、WFST等技術。
深度學習建模方面:完整介紹nnet、nnet2、nnet3。

大家最常用的語音搜尋、語音喚醒也有完整的實作介紹。類似人臉辨識的「人聲」辨識,也用PLDA、i-vector、x-vector等技術實作,最近當紅的語言辨識也沒錯過,可說是深入語音工程的最佳手冊。


語音 工程 深度學習 AI 人臉辨識 辨識 模型 KALDI