軟硬結(jié)合的智能視覺讓機(jī)器人行動更靈敏
機(jī)器人,這一長期出現(xiàn)在科幻世界和航運(yùn)產(chǎn)品文檔中的事物,被描述為能夠幫助人類從呆板、單調(diào)和難以忍受的工作中釋放出來,并利用其高速度及高精度的特點(diǎn)提升工作效果。無論是可完成吸塵、地毯清洗,甚至排水溝的清潔工作的第一代自主消費(fèi)機(jī)器人系統(tǒng),或是多種類型的生產(chǎn)環(huán)境下機(jī)器人的使用正不斷增長,都可以說明上述觀點(diǎn)(圖1)。
圖1:為消費(fèi)者量身定制的自主產(chǎn)品(a)和工業(yè)制造系統(tǒng)(b)是眾多可以通過視覺處理功能而得到增強(qiáng)的機(jī)器人中的一部分。
人類用眼睛(以及感覺)和大腦對其周圍的世界進(jìn)行辨識和定位。從理論上講,采用攝像頭組件、視覺處理器和各種軟件算法的機(jī)器人系統(tǒng)也應(yīng)該可以做到。但縱觀歷史,這樣的圖像分析技術(shù)通常只有在復(fù)雜并且昂貴的系統(tǒng)中才能找到。但數(shù)字集成電路在成本、性能和功耗方面的進(jìn)步,為視覺功能使用在多樣化和高容量的應(yīng)用上鋪平了道路,其中包括機(jī)器人實(shí)現(xiàn)的功能越來越多。雖然機(jī)器人在功能實(shí)現(xiàn)方面仍然面臨著諸多挑戰(zhàn),但與以往相比,今天已經(jīng)可以更加輕松、快速、經(jīng)濟(jì)高效地解決這些問題。
軟件技術(shù)
開發(fā)出可根據(jù)視覺適應(yīng)其環(huán)境的機(jī)器人系統(tǒng)需要采用電腦視覺算法,該算法可將一個或多個圖像傳感器中的數(shù)據(jù)轉(zhuǎn)換成該環(huán)境的可執(zhí)行信息。機(jī)器人的兩個常見任務(wù)分別是識別外部目標(biāo)和方向,并決定機(jī)器人的位置和方向。許多機(jī)器人可與一個或多個特定目標(biāo)進(jìn)行互動。對于情境自適應(yīng)機(jī)器人而言,必須能夠檢測到那些在未知地點(diǎn)和方向的目標(biāo),并且還要了解到這些目標(biāo)很可能會移動。
攝像頭每秒產(chǎn)生上百萬像素的數(shù)據(jù),從而形成了一個肩負(fù)著沉重處理負(fù)擔(dān)的有效載荷。解決該問題的一種常見方法是檢測這些多像素的特征,如視頻數(shù)據(jù)每一幀的角、點(diǎn)、邊或線(圖2)。
圖2:完整處理二維或三維機(jī)器人視覺傳感器的原始輸出涉及四個主要階段,
每個階段都有自己的獨(dú)特性并受其處理要求的制約。
圖3:視覺處理器可以集成多種類型的內(nèi)核,以滿足每個處理階段的獨(dú)特需求。
通過特征來確定目標(biāo)方位需要一種像RANSAC (隨機(jī)抽樣和均測)那樣的基于統(tǒng)計(jì)的算法。該算法采用一組特征來模擬一個潛在的目標(biāo)方向,然后確定多少其他特征適合該模型。具有最大數(shù)量匹配特征的模型對應(yīng)于被正確識別的目標(biāo)方向。為了檢測移動目標(biāo),用戶可以將特征識別與跟蹤算法相結(jié)合。一旦一組特征正確地識別了一個目標(biāo), KLT(Kanade-Lucas-Tomasi)或卡爾曼濾波等算法將在視頻的幀之間跟蹤這些特征的運(yùn)動軌跡。無論方向和阻塞如何改變,這些技術(shù)都是非??煽康?,因?yàn)樗麄儍H需要跟蹤一組最初特征便可成功。
評論