基于Gabor小波與RBF神經(jīng)網(wǎng)絡(luò)的人臉識別新方法

作者：時(shí)間：2009-08-10 來源：網(wǎng)絡(luò)

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢

完成上述步驟之后，每人最多對應(yīng)于3個(gè)隱層節(jié)點(diǎn)，整個(gè)RBF網(wǎng)絡(luò)的結(jié)構(gòu)隨之確定。

本文引用地址：http://www.2s4d.com/article/157900.htm

3．2 RBF網(wǎng)絡(luò)混合學(xué)習(xí)算法
網(wǎng)絡(luò)學(xué)習(xí)就是通過調(diào)整連接權(quán)W(j，k)、隱層中心Ck和寬度σk，以減小輸出誤差。隱層參數(shù)Ck、σk的調(diào)整是非線性過程，學(xué)習(xí)速度較慢；而W(j，k)調(diào)整是線性過程，學(xué)習(xí)速度較快。因此，RBF網(wǎng)絡(luò)的每一次訓(xùn)練分為兩個(gè)層次進(jìn)行。
3．2．1 連接權(quán)調(diào)整
設(shè)輸出目標(biāo)矩陣T∈Rsxn，其元素t(j，i)為0或?yàn)?，表示Pi是否屬于j類，T每列有、且僅有一個(gè)元素為l，表示Pi所屬類別。定義誤差函數(shù)為：

y(j，i)表示Pi在輸出層j節(jié)點(diǎn)的輸出yj(Pi)，可通過線性最小二乘法求解最佳權(quán)值W*。
3．2．2 隱層中心及寬度調(diào)整
W固定，由(11)式采用梯度下降法，經(jīng)推導(dǎo)可得Ck和σk的迭代計(jì)算公式為：

其中梯度矢量為：

式中η1、η2分別為隱層中心Ck和寬度σk的學(xué)習(xí)速率(η1，η2>O)，m為迭代次數(shù)。
σk的學(xué)習(xí)速率通常大于Ck的學(xué)習(xí)速率(選取η2=2η1)。但ηl或η2的選取一般只能通過試驗(yàn)分析確定。為此，本文從(13)式出發(fā)，提出了學(xué)習(xí)速率η2的估算方法。設(shè)σk(0)為高斯寬度的初值，經(jīng)推導(dǎo)可得η2的估算公式如下：

式中a為常數(shù)項(xiàng)，用于控制學(xué)習(xí)速率大小。實(shí)驗(yàn)表明a=0．01可以較好的滿足條件。

4 實(shí)驗(yàn)結(jié)果
試驗(yàn)選用0RL人臉數(shù)據(jù)庫，共包括40個(gè)人的臉部圖像，其中每人lO幅具有豐富的面部表情和姿態(tài)變化。在未對ORL人臉進(jìn)行任何預(yù)處理的條件下，選取每人的前5幅圖像共200幅進(jìn)行訓(xùn)練，另外200幅用于識別。然后將訓(xùn)練與識別圖像相互交換，再次進(jìn)行實(shí)驗(yàn)，識別正確率取兩次試驗(yàn)結(jié)果的均值。表1、表2、圖4和表3“任選5幅”部分的實(shí)驗(yàn)都是基于上述方法。為了便于比較，對于表3的1至4行的識別率是從相應(yīng)參考文獻(xiàn)上引用過來，第5行即本文方法是作者根據(jù)本文提出的算法進(jìn)行實(shí)驗(yàn)的結(jié)果，其中對于“任選3幅”是指第一次選取每人的前3幅圖像共120幅進(jìn)行訓(xùn)練，余下280幅用于識別，第二次再選取每人的后3幅圖像共120幅進(jìn)行訓(xùn)練，余下280幅用于識別，識別率取兩次結(jié)果的平均；“任選5幅(1幅側(cè)面)”是指每人參與訓(xùn)練的樣本都含1幅側(cè)面的圖像，其它與“任選5幅”的相同。
首先對第二個(gè)類別細(xì)分判別規(guī)則進(jìn)行了驗(yàn)證。表l列出了設(shè)置不同判別規(guī)則，兩次試驗(yàn)所得RBF網(wǎng)絡(luò)的隱層節(jié)點(diǎn)個(gè)數(shù)以及識別錯(cuò)誤的圖像數(shù)目。
表1可以看出，“正確歸類規(guī)則”的設(shè)置比較合理，改變規(guī)則或者各個(gè)聚類不作細(xì)分，識別成功率較低。而且按照本文的聚類初始化方法，所得RBF網(wǎng)絡(luò)的隱層節(jié)點(diǎn)數(shù)目很少。40個(gè)人的訓(xùn)練樣本，只有少數(shù)幾個(gè)人的特征矢量需要進(jìn)行類別細(xì)分。所以，本文的初始化方法得到的網(wǎng)絡(luò)結(jié)構(gòu)非常簡單，網(wǎng)絡(luò)的學(xué)習(xí)訓(xùn)練和分類識別具有較高的效率，并具備優(yōu)異的泛化能力。

從表1還能看出，采用前五幅圖像和后五幅圖像進(jìn)行訓(xùn)練，后者識別成功率明顯高于前者。其中兩幅識別錯(cuò)誤的人臉以及相應(yīng)的訓(xùn)練樣本，如圖3所示。

圖3中每行最后一幅為識別錯(cuò)誤圖像，前五幅為訓(xùn)練圖像?？梢钥闯?，前五幅人臉之間的姿態(tài)變化較小，而測試人臉的姿態(tài)與訓(xùn)練樣本差別較大。若采用前五幅圖像訓(xùn)練將會使得RBF網(wǎng)絡(luò)隱層神經(jīng)元的聚類寬度偏小，造成這幾個(gè)測試樣本與本屬同類的隱層聚類中心相對距離較遠(yuǎn)，神經(jīng)元激活程度不夠，從而導(dǎo)致分類識別錯(cuò)誤。當(dāng)采用不同姿態(tài)的人臉訓(xùn)練時(shí)，同類樣本問的差異可以使得RBF網(wǎng)絡(luò)的學(xué)習(xí)更加充分，有利于正確地分類識別。
通過實(shí)驗(yàn)，8個(gè)方向的濾波器若忽略其中任何一個(gè)方向，識別正確率都明顯下降，說明對于多姿態(tài)人臉來說，各個(gè)方向的人臉Gabor特征都不可缺少。若使用全部40個(gè)濾波器運(yùn)算量又太大，同時(shí)也不能獲得更好的結(jié)果。限于篇幅，表2列出了全8個(gè)方向與部分頻率組合的實(shí)驗(yàn)結(jié)果比較，從表2可以看出選取空間頻率v∈{1，2}或v∈{0，1，2}均能獲得最佳識別結(jié)果，故本文在2個(gè)空間頻率v∈{l，2}和8個(gè)方向μ∈{0，…，7}上進(jìn)行采樣，形成16個(gè)Gabor濾波器。

圖4表示對Gabor人臉采用小波分解和采樣法進(jìn)行降維處理的識別結(jié)果。由圖4可知，小波分解方法明顯優(yōu)于采樣法，本文特征提取方法的最佳維數(shù)在140維左右。

由表3可知，同樣采用基于RBF神經(jīng)網(wǎng)絡(luò)的分類器：與方法l相比，基于Gabor小波的特征提取方法優(yōu)于主分量分析(PCA)與Fisher線性鑒別變換(FLD)的組合；方法2采用高階偽澤爾尼克不變矩表征人臉，需要運(yùn)用橢圓模型對人臉進(jìn)行精確的尺度校正和分割。方法3采用5個(gè)頻率的40個(gè)Gabor濾波器，本文選用2個(gè)頻率的16個(gè)濾波器，在識別速度和占用內(nèi)存等方面具有顯著優(yōu)勢。方法4采用自組織稀疏RAM的N―tuple神經(jīng)網(wǎng)絡(luò)分類器，對于小樣本具有較好的泛化逼近能力，本文算法在相同試驗(yàn)條件下具有不相上下的識別率。

5 結(jié)論
實(shí)驗(yàn)表明Gabor小波對于人臉位置、圖像亮度變化具備較好的適應(yīng)能力，在基于二維圖像的人臉識別方法中具有一定的優(yōu)越性。同時(shí)，也注意到前人研究成果主要針對128×128的人臉圖像，進(jìn)一步的研究工作可以根據(jù)Gabor小波的構(gòu)造原理，選取適用于較低分辨率圖像(如64x64)的濾波器參數(shù)。由于濾波處理的計(jì)算復(fù)雜度為O(d2)，人臉識別速度可以提高4倍，則有望滿足實(shí)時(shí)識別要求。
RBF神經(jīng)網(wǎng)絡(luò)具有結(jié)構(gòu)簡單、非線性逼近能力強(qiáng)、收斂速度快以及全局收斂等顯著優(yōu)點(diǎn)。本文采用的RBF神經(jīng)網(wǎng)絡(luò)初始化方法，充分利用了人臉特征矢量的相對分布信息，聚類初始化過程簡單、快速，同時(shí)可以保證RBF神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)極其簡單，具有較好的泛化能力。本文提出的學(xué)習(xí)速率估算方法具有普遍性，使得RBF網(wǎng)絡(luò)無需先驗(yàn)參數(shù)、具備自適應(yīng)能力。而且神經(jīng)網(wǎng)絡(luò)是以并行方式處理信息，采用硬件實(shí)現(xiàn)能夠達(dá)到較高速度，所以該研究成果具有廣泛意義。

矢量控制相關(guān)文章:矢量控制原理

新聞中心

基于Gabor小波與RBF神經(jīng)網(wǎng)絡(luò)的人臉識別新方法

評論

相關(guān)推薦

技術(shù)專區(qū)