時間:2025-11-03 17:06:09來源:OFweek 人工智能網
但真實真實交通場景中,經常會出現像是掉落的貨箱、翻倒的圍欄、突然出現在車道上的大塊塑料布、動物、臨時擺放的工具箱、被雨水反光蓋住的塑料膜,甚至奇形怪狀的殘骸等各種意料之外的東西。這些東西在類別上會被定義為是“未知”的,但對于自動駕駛來說卻是實際存在且絕不能忽略的。
GOD的任務就是將障礙物檢測做到“通用”,其不僅要檢測已知類別的物體,還要盡可能識別出訓練集中未出現過的異常物體,為后續的跟蹤、預測與規劃模塊提供關鍵的安全依據。
更簡單理解下,GOD不僅要判斷“那是行人”或“那是車輛”,還要在不同光照、天氣和速度條件下都能精準告訴你“前方有個實體,它會擋路或影響行駛安全”。這種能力在城市復雜路況、臨時施工路段、惡劣天氣等場景中尤為重要,因為自動駕駛不能僅依賴識別少數幾種固定標簽來保證安全,它必須對未知、罕見和危險情況保持高度敏感。
GOD是如何工作的?
GOD的輸入來源并不是單一的,最常見的輸入來源是攝像頭圖像和激光雷達點云,有時還會融合毫米波雷達或超聲波傳感器數據。攝像頭天然對語義和紋理敏感,激光雷達則能提供精確的三維幾何信息。
一個實用的GOD,其核心任務是將不同傳感器的信息融合,并輸出一組統一的“候選障礙物”。這些障礙物的表示形式可以是邊界框、分割掩碼,也可以是鳥瞰圖下的占據柵格。不僅如此,每個候選障礙物還會附帶一系列像是置信度(它真是障礙物的把握有多大)、速度估計(它移動得多快)、類別概率(如果能夠識別的話),以及不確定性評估(對上述所有判斷的可靠程度進行打分)等關鍵屬性。
部分GOD會沿用典型檢測架構,先用卷積或Transformer提取特征,再通過檢測頭輸出邊界框和分類信息。與常規障礙物檢測不同的是,GOD更強調兩點,一是處理“開放集合”問題的能力,也就是能識別“我不知道這是什么,但它很重要”的物體;二是對小物體、透明物體、反光物體和部分遮擋物具有更強的魯棒性。為實現這些目標,很多方案中會引入異常檢測子模塊、輸出分割式掩碼、融合幾何一致性校驗(比如將激光雷達深度投影與相機檢測結果對比,不一致時提高關注等級)等技術。
對于GOD來說,時間維度非常關鍵。GOD不會僅憑單幀圖像就做出判斷,而是會結合時序信息來增強穩定性,通過運動學一致性跟蹤,可以濾除臨時誤檢,也能維持被短暫遮擋但已出現在軌跡上的物體。
GOD的核心技術點與實現細節
GOD可基于傳統的一階段或兩階段檢測器實現,一階段檢測器(如基于錨框的RetinaNet,或無錨框的CenterNet、FCOS)直接預測目標位置與類別;兩階段檢測器(如Faster R-CNN系列)則是先生成候選區域,再對其進行精細分類與調整。近年來,Transformer架構(如DETR及其系列模型)也被引入障礙物檢測領域,它能夠直接建模全局上下文關系,但在實際應用中,仍需考慮計算成本與收斂速度。
在骨干網絡設計上,模型需兼顧性能與效率。對于視覺輸入,常采用ResNet、EfficientNet等經典網絡提取特征,為適應車規級芯片的算力限制,也會使用更輕量的MobileNet、GhostNet來實現。而對于激光雷達點云數據,常用的處理方法是基于體素的三維卷積、基于點直接處理的PointNet/PointNet++,或是采用近年來效率更高的稀疏卷積架構。
GOD不僅要優化目標定位和分類精度,還會引入專門的異常/新穎性損失,以提高對未見類別的敏感度。一些技術方案中會使用對比學習或自監督預訓練,幫助模型掌握“正常背景”的分布,從而更容易識別偏離分布的物體。還有一種思路就是將檢測任務拆為兩部分,常規的有限類別檢測使用交叉熵或Focal Loss等優化,而“通用物體存在性”則通過自監督異常分數或重建誤差來表示。
訓練數據是決定效果的關鍵,要讓檢測器對各種“奇怪”的物體有感知能力,僅靠現有的行車數據集是不夠的,還需引入額外的稀有樣本、合成數據,或利用仿真環境生成的異常場景來擴展訓練集。常用的數據增強手段包括隨機遮擋、顏色擾動、光照變化與幾何畸變等;還有更進階的做法就是將單幀圖像與激光雷達生成的稠密深度或鳥瞰投影結合,利用幾何一致性監督提升對透明或反光物體的檢測能力。
聊了這么多技術細節,那GOD的實際效果會如何呢?傳統目標檢測是依賴mAP(平均精度)、精確率/召回率、IoU(交并比)等靜態指標進行評估的。但對于通用障礙物檢測(GOD),這些指標并不完全適用,其必須考量漏檢與誤報所帶來的實際風險。如果漏檢一個車道上的箱子,就可能直接導致碰撞事故,而頻繁的誤報則會無故觸發緊急制動,這不僅會嚴重影響乘坐體驗,也會帶來不必要的跟車風險。因此,GOD的評估體系必須超越靜態指標,納入如“安全臨界距離”或“碰撞時間”等體現實時威脅程度的動態因素。
GOD會有哪些挑戰?
將GOD應用到實車上,其實會遇到很多現實問題。由于傳感器本身存在局限,相機在夜晚或逆光條件下性能會下降,激光雷達對透明物體(如玻璃、薄膜)不敏感,毫米波雷達對小物體分辨率低。這就需要不同傳感器之間互相補足。為了解決這個問題,比較穩妥的做法是對不同傳感器的檢測結果進行融合判斷,如果相機識別到有明顯紋理但激光雷達沒有回波的物體,系統不會立即下結論,而是將其標記為“高不確定性”障礙物,交由跟蹤與規則模塊持續觀察。同時,系統也會結合場景上下文進行判斷,從而確保行車安全,像是在施工區域,就可以根據高精地圖或地理數據庫信息,提高對該區域的檢測敏感度。
由于真實的交通環境是開放的,且會存在很多的長尾問題,真實道路上的物體種類和形態變化一定會遠超訓練集的覆蓋范圍。因此需要擴大訓練集,對稀有場景進行標注和加強采樣;還要采用無監督/自監督方法建立“正常世界”模型,將任何偏離正常分布的物體視為潛在障礙;此外,還需借助元學習或少樣本學習,讓模型快速適應新出現的類別。
車輛在高速行駛時,檢測模塊的延遲必須控制在幾十毫秒內,而算力受限于車載計算平臺(往往是功耗和散熱受限的車規級SoC)。想讓GOD檢測正常,就需要做大量優化工作,其實包括模型壓縮、量化、使用高效算子加速推理、將部分計算任務調度到專用加速器上,以及在系統層面進行優先級管理(如將車道保持和前方最近障礙物檢測設為更高優先級)等。降級策略的設計也是非常有必要的,當計算資源緊張或傳感器異常時,系統應能夠切換到如降低車速、增大安全車距,或交由遠程人工監控等更保守但更可靠的感知/規劃模式。
一個合格的GOD系統不僅要在標準測試集上表現良好,還必須能夠應對對抗攻擊(例如針對相機的貼紙干擾)、光學失真,以及部分傳感器失效等情況,并具備明確的降級處理機制。因此,要利用仿真場景進行大規模corner case測試,甚至將現實世界中出現的故障樣本回放到仿真環境中進行壓力驗證,從而確保魯棒性。
上一篇:開關管工作狀態的斷開狀態和...
下一篇:簡介鋰離子電池的優勢
傳動網版權與免責聲明:凡本網注明[來源:傳動網]的所有文字、圖片、音視和視頻文件,版權均為傳動網(www.cdcst56.com)獨家所有。如需轉載請與0755-82949061聯系。任何媒體、網站或個人轉載使用時須注明來源“傳動網”,違反者本網將追究其法律責任。
本網轉載并注明其他來源的稿件,均來自互聯網或業內投稿人士,版權屬于原版權人。轉載請保留稿件來源及作者,禁止擅自篡改,違者自負版權法律責任。
產品新聞
更多>2025-10-31
2025-10-22
2025-10-17
2025-10-11
2025-10-09
2025-09-23