新聞中心

EEPW首頁 > 消費電子 > 設計應用 > 支持向量機語音識別算法在OMAP5912上的移植

支持向量機語音識別算法在OMAP5912上的移植

作者: 時間:2010-08-19 來源:網絡 收藏

2.4.4 拷貝根文件系統(tǒng)
拷貝根文件系統(tǒng)到/data/rootfs2.6目錄下,這時就可以啟動minicom,作為虛擬終端,可以通過它來操作開發(fā)板。
2.5 修改開發(fā)板啟動項
bootargs參數設置Linux系統(tǒng)啟動時掛載在NOR Flash上的JFFS2根文件系統(tǒng)。掛載宿主機上的網絡文件系統(tǒng),則bootargs參數應設置
setenv bootargs=console=ttyS0,115200n8 noinitrd rw ip=192.168.0.158 root=/dev/nfs nfsroot=192.168.0.204:/data/rootfs2.6.nolock mem=62M
#sayenv保存設置后重啟u-boot,之后將順利進入到開發(fā)板,調試應用程序。

3 實驗及結果分析
基于VC++6.0編程實現一種多類分類SVMs,PC機環(huán)境為Ubuntu version 2.6.27,開發(fā)板為Omap5912的ARM926ej-s,其環(huán)境為Lin-ux version 2.6.18;Boot Loader采用u-boot version 1.1.6;交叉編譯工具鏈arm-linux-gcc version3.4.1。
采用16個人分別對50個詞的孤立詞發(fā)音,在不同信噪比下(15、20、25、30 dB和無噪音)得到的數據作為樣本,采用由MFCC特征提取得到的特征參數作為網絡的輸入。信號采樣率為11.025 kHz,幀長N=256點,幀移M=128點。詞匯量分別為10、20、30、40和50個詞。訓練樣本由9人每人對每詞在15、20、25、30 dB、無噪音下發(fā)音3次得到.測試樣本由另外7人在相應SNR下對每詞發(fā)音3次得到。采用RBF核函數的SVM算法,采用交叉驗證和網格搜索法進行核參數選擇并建立模型,對測試樣本進行分類。核函數參數取最優(yōu)為(c,y)=(32.0,O.000 122 070 312 5)。實驗結果見表l所示,識別率均在95%以上。表1中同時列出同樣條件下使用HMM識別網絡的識別結果。

本文引用地址:http://www.2s4d.com/article/166634.htm


HMM模型是典型的識別模型,它是目前語音識別效果最好的少數幾種方法之一。在相同特征參數下將SVM與HMM模型進行對比,從實驗結果看出:1)SVM比HMM模型具有更高的識別率;2)比較相同信噪比和詞匯量下的測試精度,可發(fā)現HMM模型的測試精度有明顯下降,而SVM的測試結果下降較少,說明SVM比HMM模型具有更強推廣性。

4 結束語
提出一種基于SVM的0MAP5912非特定人嵌入式語音識別系統(tǒng)的實現方法。在搭建的開發(fā)環(huán)境下運用SVM算法巾的“一對一”方法進行語音識別,獲得良好結果。通過實驗可以得出,對中小詞匯量采用MFCC特征參數,“一對一”SVM作為后端識別方法可以得到較好的識別結果,比傳統(tǒng)的HMM模型有明顯優(yōu)勢。同時SVM算法作為應用程序集成到0MAP5912嵌入式系統(tǒng)里,存儲量需求小,能夠滿足實用要求。


上一頁 1 2 3 下一頁

評論


相關推薦

技術專區(qū)

關閉