智能駕駛中的感知模塊介紹

發(fā)布人：地平線開發(fā)者時間：2025-02-23 來源：工程師

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢

在自動駕駛系統(tǒng)中，感知技術(shù)是核心基礎(chǔ)之一。感知技術(shù)為車輛提供環(huán)境信息，使其能夠?qū)崿F(xiàn)對周圍環(huán)境的理解、分析與決策，從而保證安全性和高效性。通常大家對感知的介紹停留在“眼睛”的作用，但這樣的解釋太寬泛了例如感知到底是什么？由哪些模塊組成？輸入輸出有什么含義？數(shù)據(jù)怎么流轉(zhuǎn)的？會經(jīng)歷哪些硬件模塊？下面來簡單看一下。

現(xiàn)在大家不都是在提倡感知規(guī)控“端到端”嗎？為什么還要拆開介紹？個人理解：完全端到端還有很長一段時間要走，了解感知模塊，沒什么壞處。

1.感知的定義

感知是指通過傳感器獲取環(huán)境信息并將其轉(zhuǎn)化為可用數(shù)據(jù)的過程。在自動駕駛中，感知技術(shù)主要包括目標檢測、識別、跟蹤、分割、預(yù)測等。沒有可靠的感知技術(shù)，下游規(guī)控很難進行決策，自動駕駛系統(tǒng)也很難實現(xiàn)安全駕駛。

2.感知硬件

感知系統(tǒng)通常由多種傳感器和數(shù)據(jù)處理單元組成。常見的傳感器包括：

激光雷達（LiDAR）：通過激光掃描獲取高精度的三維點云數(shù)據(jù)，能夠準確測量物體的位置和形狀。
攝像頭：提供高分辨率的視覺信息，用于識別物體的顏色、形狀以及交通標志等。
毫米波雷達：擅長檢測動態(tài)物體，尤其適合在惡劣天氣條件下工作。
超聲波傳感器：用于近距離障礙物檢測，常用于泊車場景。

有了這些傳感器，怎么把它們采集到的信息用起來呢？這就涉及到數(shù)據(jù)流轉(zhuǎn)的計算單元了。常見的數(shù)據(jù)處理單元包括：

Image Pyramid（簡稱Pyramid，圖像金字塔）用于對輸入的圖像按照金字塔圖層的方式處理，并輸出到DDR，可實現(xiàn)對圖像多尺度的縮小、裁剪，輸出圖像數(shù)據(jù)可直接用于BPU上的模型推理；
GDC (Geometry and Distortion Correction，幾何校正和失真校正)可將輸入的圖像進行視角變換、畸變校正和指定角度（0,90,180,270）旋轉(zhuǎn)，常用于對魚眼相機圖像的畸變矯正；
Stitch可對輸入的圖像進行裁剪、拼接，常用于AVM的環(huán)視圖像拼接；
ISP(Image Signal Processing) 圖像信號處理。主要用來對前端圖像傳感器輸出信號處理的單元，以匹配不同廠商的圖像傳感器。
NPU(NeuralNetwork Processing Unit)神經(jīng)網(wǎng)絡(luò)處理器：常見的有GPU、BPU等。
CPU(Central Processing Unit)中央處理器，常用于解釋計算機指令以及處理軟件中的數(shù)據(jù)。

有了輸入數(shù)據(jù)傳感器和數(shù)據(jù)處理單元后，下面就涉及到感知模塊常用的算法了。

3.關(guān)鍵算法

智能駕駛感知技術(shù)依賴于多種算法模型，以下是幾種常用的算法：