近日,海康威視研究院在KITTI評測中排名世界第一,表明其在計算機視覺算法上取得了重大突破。在車輛檢測和車頭朝向估計兩項任務中,分別取得了87.27%與83.75%的AP(Average Precision)值,均排名第一。參加這項評測的研究機構及高校包括百度深度學習研究院、NEC北美研究院、加州大學等世界頂級研究團體。
KITTI是德國卡爾斯魯厄理工學院和芝加哥豐田技術研究所聯合創辦的一個算法評測平臺,旨在評測對象(機動車、非機動車、行人等)檢測、目標跟蹤等計算機視覺技術在車載環境下的性能,為機動車輔助駕駛應用做技術評估與技術儲備。
在車輛檢測這一競賽項目上,要求參賽者使用計算機視覺算法檢測出由車載相機所拍攝的城市街道上的車輛,并且估算出車頭朝向。用于性能測試的KITTI數據集包含了7千多張車載圖像,單張圖像上尺度不同的車輛數目最多可達十幾輛,因此部分車輛會被其它車輛遮擋,檢測難度非常大。海康威視研究院的預研團隊基于深度學習算法,采用多任務聯合學習框架,在性能上取得了突破性進展。
“車輛檢測算法可用于汽車的輔助駕駛系統,為自動駕駛技術提供支持。我們預研的檢測算法是一個通用的框架,可用于檢測任意物體,在視頻監控及車載監控領域具有廣泛的應用價值。”海康威視研究院算法預研組負責人謝迪博士說。
“海康威視研究院的團隊成員都是精兵強將。我們是一個年輕的團隊,但我們有扎實的功底和堅定的信念。我們的目標就是向世界頂級的研究機構看齊,為公司的發展提供堅強有力的技術支持,進而推動行業的發展。”海康威視研究院常務副院長浦世亮博士說,2015年5月26日,習近平總書記蒞臨研究院,勉勵科技人員多出成果,“這給了我們極大的鼓勵。”
據了解,海康威視研究院由智能分析、大數據技術、感知技術和多媒體技術等專業團隊組成,突出在音視頻技術的專注和積累,著重研究視音頻的智能算法、大數據的分析、挖掘和計算,同時針對新的圖像傳感器等感知技術,視頻的播放技術,人機交互等多媒體技術進行深入研究。目前在海康威視研究院眾多領域的研究都走在行業前列。
http://www.cvlibs.net/datasets/kitti/eval_object.php
下圖為車輛檢測排名結果
下圖為車輛朝向估計排名結果
|