博客專欄

EEPW首頁 > 博客 > 5分鐘速通 AI 計算機視覺發(fā)展應(yīng)用

5分鐘速通 AI 計算機視覺發(fā)展應(yīng)用

發(fā)布人:AI科技大本營 時間:2022-03-12 來源:工程師 發(fā)布文章

作者 | 李秋鍵

出品 | AI科技大本營(ID:rgznai100)

計算機視覺是進步最大、發(fā)展最快的領(lǐng)域之一。根據(jù) Global VIEW 的研究,全球計算機視覺市場規(guī)模在 2020 的價值為 113 億 2000 萬美元,預(yù)計從2021 到 2028 的復(fù)合年增長率為 7.3% 。人工智能計算機視覺的使用案例幾乎不計其數(shù),其中最受歡迎的是無人機以及自動和半自動車輛。今天小編帶大家?guī)追昼娝偻?AI 計算機視覺發(fā)展應(yīng)用。


圖片

應(yīng)用前景


(1)物流:

利用計算機圖像識別、地址庫、合卷積神經(jīng)網(wǎng)提升手寫運單機器有效識別率和準確率,大幅度地減少人工輸單的工作量和差錯可能。

(2)肺部疾病影像診斷:

使用圖像分割算法對肺部掃描序列進行處理,生成肺部區(qū)域圖,然后根據(jù)肺部區(qū)域圖生成肺部圖像。利用肺部分割生成的肺部區(qū)域圖像和結(jié)節(jié)標準信息生成結(jié)節(jié)區(qū)域圖像,對基于CNN的肺結(jié)節(jié)分割器進行訓(xùn)練,然后對圖像進行肺結(jié)節(jié)分割,得到疑似肺結(jié)節(jié)區(qū)域。找到疑似肺結(jié)節(jié)后,使用3D CNN對肺結(jié)節(jié)進行分類,得到真正肺結(jié)節(jié)的位置和置信度。

(3)垃圾桶智能監(jiān)護:

首先,攝像頭拍攝垃圾照片,并將照片上傳至信息處理器,信息處理器對照片識別后,對垃圾進行分類;然后生成分類結(jié)果,再將結(jié)果發(fā)送到信號燈指示器;最后,對應(yīng)的垃圾類別的信號燈就會亮起,提示人應(yīng)該投入哪個投放口。需要注意的是,垃圾桶應(yīng)配備傳感器和感應(yīng)開關(guān),并且應(yīng)當(dāng)設(shè)置在垃圾桶外殼與投放口相對應(yīng)的位置。顯示屏最好選用觸摸屏,便于用戶操作和調(diào)整設(shè)置以及控制攝像頭。

(4)交通:

(一)用于自適應(yīng)信號控制機檢測

1. 對車輛的檢測

無論是針對全感應(yīng)信號控制機還是半感應(yīng)信號控制機,圖像識別技術(shù)可以實時檢測主干道或次干路車道上的車輛到達和排隊情況,并可通過算法分析,對交叉口信號控制機進行實時數(shù)據(jù)更新,以保證最優(yōu)算法,提供通暢的交通條件,在一定程度上避免了上下游交通擁堵。

2. 對行人的檢測

在城市化建設(shè)的重要發(fā)展中,CBD商業(yè)步行街越來越彰顯一個城市的文化精神之地,但大部分的商業(yè)街都是開放性的,如成都寬窄巷子等,這些旅游熱點,往往是人潮擁擠,將其感應(yīng)控制理念用于該交叉口的信號控制機,即采取車輛相位的最小綠燈時間和行人相位的最大綠燈時間,會大大提高行人和車輛的有效綠燈時間,并使得行人與車輛有序、暢通、安全地進行交通組織。而識別技術(shù)可以作為決策最小和最大綠燈時間的“發(fā)現(xiàn)者”;它可以在半感應(yīng)控制系統(tǒng)中實時檢測出車輛,并最大化地疏通行人;或在全感應(yīng)控制系統(tǒng)中將兩相行人流量和車輛流量反饋給信號控制機,從而優(yōu)化交叉口的信號相位,達到確保行人、車輛的有序安全組織。

(二)用于潮汐車道的自適應(yīng)檢測

隨著現(xiàn)代化都市工作節(jié)奏的加快,城市的交通流形成了周期性、潮汐性的現(xiàn)象;而潮汐車道應(yīng)運而生,但面臨波動的車流和交通區(qū)位的不同,為了保證潮汐車道的連續(xù)性,現(xiàn)有的潮汐車道都是穩(wěn)定的時間點變化,即在規(guī)定時間內(nèi),該車道是上行還是下行方向,這樣的設(shè)定時段式控制法,不具靈活性,由于早高峰和晚高峰具有不同集群的特點,因此忽略了交通的動態(tài)變化性這個特點。

根據(jù)大城市多具有放射環(huán)狀式路網(wǎng)布局的特點,采用識別技術(shù)在城市中心多個射線沿路上的交叉口進行采集點布局,將上游路段實時反饋給下游,再結(jié)合電子屏實時信號控制,充分發(fā)揮潮汐車道的機動性,在時間上給予車流最大節(jié)省,從而緩解城市的擁堵,尤其是高峰期的擁堵。

圖片

(三)用于無人駕駛場景下的檢測

隨著人工智能的發(fā)展,無人駕駛在國內(nèi)也得到了多個科研機構(gòu)和大型企業(yè)的進一步探索,而試運車也在上海廣州等地正式上路,這說明無人駕駛時代即將在不遠的將來走進人們的生活,而面對如此復(fù)雜的交通環(huán)境,尤其是城市交通,要保證慢行交通尤其是步行者——人的安全,就要充分發(fā)揮無人駕駛各個傳感器的綜合優(yōu)勢,而攝像頭作為其環(huán)境感知部分的重要部分之一,將深度學(xué)習(xí)和機器視覺同時融合,讓無人車輛在上路前學(xué)會大量的城市場景儲備,同時識別技術(shù)在無人駕駛車真正路用時發(fā)揮其作用,輔助車輛精準判別各類復(fù)雜的交通場景,并相應(yīng)的給出決策行為。

圖片

(5)紡織品及服裝:

  • 纖維及織物組織識別

紡織階段,圖像識別技術(shù)可用于識別區(qū)分各類纖維及其織物,還可用于原棉加工前識別非棉雜質(zhì)。對于織物組織結(jié)構(gòu),針織物中對緯編組織的研究較多,如對其編織周期的識別及組織結(jié)構(gòu)的編碼分類等。機織物中目前能夠識別出織物中的三原組織;還可輔以亮度累加法檢測分割經(jīng)緯紗線、定位組織點,用于計算紗線密度和組織點的自動分類。但由于織物組織結(jié)構(gòu)復(fù)雜多樣,即使是人工識別,若非專業(yè)人士也難以輕易辨認,因此目前大多相關(guān)研究還停留在人工與計算機交互操作提取特征進行識別,難以大范圍推廣。

  • 織物疵點檢測

織物疵點檢測經(jīng)過十?dāng)?shù)年的發(fā)展,已基本能完成疵點判別、疵點分割、疵點分類等功能,并應(yīng)用于工業(yè)。識別準度是其中較為重要的驗收指標,但在保證準度的前提下,識別速度也需逐步提高,目前疵點在線監(jiān)測的速度要求一般高于60 m/min,檢測的疵點最小尺寸為0.5 mm。近年進展多為提高精細度及速度、擴展識別疵點類別及檢驗規(guī)范化等,還有部分學(xué)者在對織物褶皺及折痕的研究中也使用了圖像識別相關(guān)技術(shù),提出多視域織物外觀平整度客觀評級方法,嘗試讓機器判斷織物平整度并驗證,為織物表現(xiàn)性能的評估提供了有效的解決方案。

  • 面料檢索

面料圖像的商業(yè)價值和大眾使用率較高,消費者和生產(chǎn)商都有挑選符合自己預(yù)期面料的需求;且面料圖像的顏色、紋理、形狀等底層特征相對較為簡單明晰,易于被計算機提取和區(qū)分。計算機除了能夠通過對比面料圖像實現(xiàn)相似面料的檢索之外,還可基于對部分特征明顯的面料進行感性屬性定義,實現(xiàn)對面料的主觀情感標注。如分析面料顏色的飽和度、對比度、色彩關(guān)系及紋理、圖案等,人工將客觀指標歸納至感性認知,用于面料檢索和推薦。但目前的面料檢索研究樣本仍較為單一,多為同類面料不同色彩,或同類面料不同圖案的研究,且人工定義情感屬性局限較大,可嘗試多維度多分類研究。

  • 服裝領(lǐng)域

服裝領(lǐng)域中,對人體體型及服裝款式圖、樣板圖的識別多為服裝院校和服裝專業(yè)研究者完成;而計算機、信息技術(shù)領(lǐng)域等學(xué)者通常從識別服裝實物圖、著裝圖入手,對相關(guān)圖像進行識別、檢索、分割、分類及標注等。

  • 人體體型識別

人體是服裝的基礎(chǔ),服裝的智能化生產(chǎn)離不開對個體體型的研究及描述。對人體體型的研究多基于來源于二維測量或三維人體掃描的數(shù)據(jù),但就圖像識別技術(shù)發(fā)展以來,也漸有學(xué)者致力于對圖像信息的分析以識別體型。一般是對人體二維照片進行預(yù)處理后提取輪廓曲線,再用一定的描述方法對曲線分類、以達到對體型分類的目的。

  • 服裝款式圖與樣版圖識別

關(guān)于服裝款式圖,可運用shock graph技術(shù)提取形狀特征再對其分類;對于樣版圖,可對樣版邊緣進行識別,在樣片文件中儲存縫紉信息以用于自動縫紉技術(shù)。但服裝行業(yè)中的款式圖風(fēng)格不一,還未形成一個統(tǒng)一規(guī)范作為分類標準;且shock graph一般用于進行形狀外輪廓的識別與匹配,不包括內(nèi)部細節(jié),無法作為樣版庫的檢索依據(jù)。需求方面,對服裝款式圖與樣版圖的識別需求較??;識別難度方面,服裝款式圖和樣版圖像只包含黑白二色及線條,無顏色和紋理特征,就發(fā)展現(xiàn)狀而言識別難度較實物圖高,需要對比不同的圖像識別模型和方法,綜合選擇最合適的方案

  • 服裝著裝圖檢索分類

服裝圖像識別可分為對服裝廓形、尺寸的識別,及服裝分類、檢索和標注。服裝廓形的識別中,一般先在人體著裝照片以人臉或人體膚色為參照來確定照片中的服裝,再對服裝掃描識別特征點、獲取數(shù)據(jù),由人體身高比例或其他公式自動計算測量服裝廓形相關(guān)尺寸,以此定義照片中的服裝廓形。借助計算機可實現(xiàn)部分服裝實物圖的尺寸及尺碼測量,但仍有較多人機交互工作量。

(6)安防領(lǐng)域的實踐應(yīng)用:

安防是每個行業(yè)都比較重視的問題之一。安防領(lǐng)域,計算機圖像識別技術(shù)應(yīng)用廣泛,比如當(dāng)前很多城區(qū)和街道都安裝了監(jiān)控,主要目的是發(fā)生事故時,可以準確查找相關(guān)資料和圖像,為事故判定提供有效依據(jù)。現(xiàn)如今,我國大多數(shù)地區(qū)都已完成了自動化視頻監(jiān)控,這是圖像識別技術(shù)處理應(yīng)用實踐的一個方式。將識別技術(shù)與安防結(jié)合,可以最大限度減輕人工勞動力,提升工作時效性,為事故糾紛提供有效依據(jù)。

圖片

(7)農(nóng)業(yè)領(lǐng)域的實踐應(yīng)用:

我國是一個農(nóng)業(yè)大國。近年來,我國在農(nóng)業(yè)中時常引進現(xiàn)代技術(shù),培養(yǎng)農(nóng)業(yè)植物實驗和新品種種植試驗都融合了現(xiàn)代圖像識別技術(shù),以此觀察植物的生長情況,從而確定影響植物生長的因素。此外,圖像識別技術(shù)可鑒定農(nóng)產(chǎn)品最終質(zhì)量,為農(nóng)業(yè)發(fā)展提供相關(guān)依據(jù)和指導(dǎo)。

(8)工業(yè)領(lǐng)域

工業(yè)領(lǐng)域,圖像識別處理技術(shù)有非常多應(yīng)用。它大大提升了工作時效性,比如自動裝配中的質(zhì)量檢測、流體力學(xué)的阻力分析、自動分揀、識別排列狀態(tài)以及設(shè)計、制造視覺效果等。其中,值得一提的是研究具備感官功能的機器人,給工業(yè)生產(chǎn)奠定了基礎(chǔ)。

(9)航空領(lǐng)域:

計算機圖像識別處理技術(shù)在航空領(lǐng)域的應(yīng)用,除了處理月球表面和火星圖片外,還有遙感技術(shù)等。經(jīng)過空中圖像處理,如將數(shù)字化數(shù)據(jù)轉(zhuǎn)為相應(yīng)信號并存入內(nèi)存,當(dāng)衛(wèi)星經(jīng)過地面上空時,高速傳送圖片,由處理中心解析。這些圖像無論是儲存、傳輸還是成像判讀,都必須采用數(shù)字圖像識別技術(shù)。現(xiàn)如今,世界各個大國都使用衛(wèi)星獲取所需圖像資源,例如災(zāi)難檢測、地質(zhì)勘探、農(nóng)城規(guī)劃等。數(shù)字圖像識別處理技術(shù)在天象預(yù)報和其他星球研究中發(fā)揮了重要作用。

(10)通信領(lǐng)域:

現(xiàn)如今,通信行業(yè)的主要發(fā)展目標是融合聲音、文字的通信。其中,圖像通信是最復(fù)雜的技術(shù)領(lǐng)域。圖像數(shù)據(jù)量較大、較廣,目前智能電視機信號傳輸必須達到100 M/s以上,想要把輸送高速數(shù)據(jù),必須使用編碼技術(shù)壓縮信息量。

(11)軍事領(lǐng)域:

軍事行業(yè),圖像識別處理技術(shù)主要分布在導(dǎo)彈、照片解讀、具備圖像傳輸?shù)淖詣踊娛孪到y(tǒng)等。目前,公安系統(tǒng)融入了圖像識別技術(shù),主要應(yīng)用于人臉識別、圖片復(fù)原等方面,例如常見的高速公路不停車收費技術(shù)是圖像識別技術(shù)的應(yīng)用成果。


圖片

圖像識別算法


(1)基于度量學(xué)習(xí)核函數(shù)的圖像識別算法:通過馬氏度量學(xué)習(xí)對光學(xué)足跡圖像訓(xùn)練樣本特征進行學(xué)習(xí)得到最優(yōu)的度量矩陣,從而構(gòu)造度量學(xué)習(xí)核函數(shù),在該核函數(shù)下再使用SVM進行分類識別.(2)基于單步目標識別架構(gòu)的輕量級裂紋圖像自動識別:單步識別算法,相比于兩步式識別算法主要優(yōu)點在于能夠提高檢出速度與降低對硬件使用的負載,通過合理地網(wǎng)絡(luò)設(shè)計能夠提高結(jié)構(gòu)視覺檢測工作的效率與質(zhì)量,最終實現(xiàn)其自動化。SSD算法包括以下組成部分:用于特征提取的Deep CNN(也稱為基礎(chǔ)網(wǎng)絡(luò),即Basenet)、特征層集合(Feature Layers)、識別分類器(Classifier)、非極大值抑制(Non-Maximum Suppression,NMS)。(3)改進Mask R-CNN的火焰圖像識別算法:基于改進Mask R-CNN的火焰圖像識別算法,算法在Mask R-CNN的基礎(chǔ)上,在特征金字塔引入一條自下向上的特征融合,同時改進了損失函數(shù),使邊框定位更準確。(4)基于RGB顏色空間:根據(jù)機場跑道路面上鮮明的顏色特征,采用抗噪性能好、識別速度快、識別精度高的RGB顏色空間識別方法進行黑色膠痕的識別。(5)基于稀疏表示和多特征融合的 SAR 圖像識別:當(dāng)采用稀疏表示進行 SAR 圖像目標識別時,可采用的特征包括灰度特征、局部特征(HOG 特征)及基于信號變換提取的特征(單演信號特征)等。進行多特征融合時,主要采用基于聯(lián)合稀疏表示的識別方法(7)基于邊緣學(xué)習(xí)的低分辨率圖像識別算法:提出了一種基于GAN結(jié)構(gòu)的邊緣學(xué)習(xí)低分辨率圖像識別算法,將通過生成網(wǎng)絡(luò)學(xué)習(xí)到的低分辨率圖像的幻想邊緣信息融入到識別網(wǎng)絡(luò)中,得到清晰的特征圖紋理輪廓,從而豐富了低分辨率圖像的高頻信息(8)基于方向梯度直方圖和灰度共生矩陣混合特征的金文圖像識別:用HOG提取金文的全局結(jié)構(gòu)特征,用GLCM提取金文的局部紋理特征,并將兩者進行融合,對金文的特征描述更為全面。最后選取支持向量機(SVM)分類器對金文圖像進行分類識別(9)基于WGAN的圖像識別方法:在GAN的生成器和判別器中加入了相同的類別標簽,指導(dǎo)樣本的生成,使GAN具有了生成多類數(shù)據(jù)的能力。(10)傳統(tǒng)算法:機器學(xué)習(xí)算法K最鄰近(K-NearestNeighbor, KNN),支持向量機(Support Vector Machine, SVM)和多層感知機(MultilayerPerceptron,MLP)等,以及近幾年比較熱門的基于深度學(xué)習(xí)和卷積神經(jīng)網(wǎng)絡(luò)(Convolutional neural network, CNN)的圖像識別算法。深度學(xué)習(xí)模型包括深度信念網(wǎng)絡(luò)(Deep Belief Network, DBN)、卷積神經(jīng)網(wǎng)絡(luò)(CNN)、循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Networks,RNN)等。這些模型通過構(gòu)建一個更深層次的網(wǎng)絡(luò),在此基礎(chǔ)上由計算機學(xué)習(xí)得到圖像更深層次的特征信息以及數(shù)據(jù)隱含的內(nèi)部關(guān)系,使學(xué)習(xí)到的特征更具有表達能力,從而分類更加準確。基于特征匹配的,比如 ORB、SIFT+SURF等等。 圖片

傳統(tǒng)圖像分割方法


  • 基于閾值的分割方法

  • 基于邊緣的分割方法

  • 基于區(qū)域的分割方法

  • 基于聚類分析的圖像分割方法

  • 基于小波變換的分割方法

  • 基于數(shù)學(xué)形態(tài)學(xué)的分割方法

  • 基于人工神經(jīng)網(wǎng)絡(luò)的分割方法

以上就是給大家整理的AI計算機視覺發(fā)展的應(yīng)用,圖像識別算法以及傳統(tǒng)圖像分割的一些方法,小伙伴們可以自取呦~

李秋鍵,CSDN博客專家,CSDN達人課作者。碩士在讀于中國礦業(yè)大學(xué),開發(fā)有taptap競賽獲獎等。


*博客內(nèi)容為網(wǎng)友個人發(fā)布,僅代表博主個人觀點,如有侵權(quán)請聯(lián)系工作人員刪除。



關(guān)鍵詞: AI

相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉