2023-06-25 09:12:01來源:手機(jī)網(wǎng)易網(wǎng)
文丨李安琪
編輯丨李勤
(資料圖)
與自動駕駛相關(guān)文章,首次獲得全球頂級計算機(jī)視覺會議CVPR的最佳論文。
6月22日,全球頂級計算機(jī)視覺會議CVPR 2023公布了最佳論文等獎項(xiàng)。一篇名為《Planning-oriented Autonomous Driving》(以路徑規(guī)劃為導(dǎo)向的自動駕駛)論文,成功從9155篇投稿、2359篇接收論文、12篇入選最佳論文候選名單中脫穎而出。
這也是近十年來,CVPR會議上第一篇以中國學(xué)術(shù)機(jī)構(gòu)作為第一單位的最佳論文。該論文由上海人工智能實(shí)驗(yàn)室、武漢大學(xué)及商湯科技聯(lián)合完成。
CVPR在學(xué)術(shù)界及產(chǎn)業(yè)界的影響力毋庸置疑,與ICCV、ECCV并列為計算機(jī)視覺領(lǐng)域三大頂級會議。全球最聰明的頭腦匯聚于此,特斯拉也連續(xù)幾年在CVPR上公布其自動駕駛技術(shù)最新進(jìn)展。
今年的競爭相當(dāng)激烈。據(jù)公開信息,今年12篇入選最佳論文候選名單機(jī)構(gòu),不僅有谷歌、Stability AI等人工智能領(lǐng)域頂尖企業(yè),也有上海人工智能實(shí)驗(yàn)室、斯坦福大學(xué)、康奈爾大學(xué)、香港中文大學(xué)、香港科技大學(xué)、南洋理工大學(xué)等研究機(jī)構(gòu)及高校。
而上海人工智能實(shí)驗(yàn)室、武漢大學(xué)及商湯科技聯(lián)合獲獎的關(guān)鍵在于,提出了一個感知決策一體化的自動駕駛通用大模型UniAD。
大會官方組委會認(rèn)為,論文提出的端到端感知決策一體框架,融合了多任務(wù)聯(lián)合學(xué)習(xí)的新范式,使得進(jìn)行更有效的信息交換,協(xié)調(diào)感知預(yù)測決策,以進(jìn)一步提升路徑規(guī)劃能力。
這證明了大模型與自動駕駛產(chǎn)業(yè)結(jié)合的潛力。今年初,ChatGPT的爆火,讓機(jī)器學(xué)習(xí)與理解人類語言的能力有了本質(zhì)飛躍。而大模型,也有望為自動駕駛產(chǎn)業(yè)落地指出更清晰的方向。
端到端的自動駕駛大模型UniAD
論文指出,隨著深度學(xué)習(xí)發(fā)展,自動駕駛算法被組裝成一系列任務(wù),包括目標(biāo)檢測與跟蹤、在線建圖、軌跡預(yù)測、占據(jù)柵格預(yù)測等子任務(wù)。
基于這些子任務(wù),行業(yè)有著多種自動駕駛系統(tǒng)框架設(shè)計:模塊化設(shè)計,多任務(wù)框架,但兩種方案都面臨著累積錯誤或任務(wù)協(xié)調(diào)不足的困擾。
比如自動駕駛公司W(wǎng)aymo、Cruise采用的模塊化設(shè)計方案,每個獨(dú)立的模塊負(fù)責(zé)單獨(dú)的子任務(wù)。這種方案具備簡化研發(fā)團(tuán)隊分工,便于問題回溯,易于調(diào)試迭代等優(yōu)點(diǎn)。但由于將不同任務(wù)解耦,各個模塊相對于最終的駕駛規(guī)劃目標(biāo)存在信息損失問題,且多個模塊間優(yōu)化目標(biāo)不一致,誤差會在模塊間傳遞。
論文認(rèn)為,多任務(wù)框架是更優(yōu)雅的一種設(shè)計方案,代表性企業(yè)有美國特斯拉、中國小鵬汽車等。方案中不同任務(wù)使用同一個特征提取器,具備便于任務(wù)拓展、節(jié)省計算資源等優(yōu)點(diǎn)。但不同任務(wù)之間仍存在預(yù)測不一致、表征沖突的問題。
a為模塊化設(shè)計、b為多任務(wù)框架、c1/c2為兩種端到端方案、c3為UniAD方案示意 圖源論文
相比之下,端到端自動駕駛方案將感知、預(yù)測和規(guī)劃所有節(jié)點(diǎn)視為一個整體,但現(xiàn)有的兩種端到端方案也還面臨挑戰(zhàn)。
一種簡單的方式直接以傳感器信號作為輸入、以軌跡/控制作為輸出,能夠在仿真中取得較好結(jié)果,但缺乏可解釋性與實(shí)際應(yīng)用安全性,尤其是在復(fù)雜的城市道路場景。
另一種方案是,對模型進(jìn)行顯式設(shè)計,將整個架構(gòu)分為感知-預(yù)測-規(guī)劃模塊,使其具有部分中間結(jié)果表達(dá)。但這種方式面臨檢測結(jié)果在模塊間不可微導(dǎo)致無法端到端優(yōu)化,稠密BEV預(yù)測時長有限,過去-未來、物體-場景等多維度信息難以高效利用等困難。
因此,本篇論文提出了一個端到端方案Unified Autonomous Driving,即UniAD。上海人工智能實(shí)驗(yàn)室指出,UniAD能夠成功解決不同任務(wù)融合難的問題,從而實(shí)現(xiàn)多任務(wù)和高性能的關(guān)鍵在于以下兩點(diǎn)。
一是多組查詢向量的全Transformer 模型:UniAD利用多組 query 實(shí)現(xiàn)了全棧 Transformer 的端到端模型,可以從具體 Transformer 的輸入輸出感受到信息融合。二是以最終“規(guī)劃”為目標(biāo),全部模塊通過輸出特定的特征來幫助實(shí)現(xiàn)最終的目標(biāo)“規(guī)劃”。
自動駕駛端到端架構(gòu) (UniAD) 的流程 圖源論文
從論文來看,UniAD 將感知、預(yù)測、規(guī)劃等三大類主任務(wù)、六小類子任務(wù)(目標(biāo)檢測、目標(biāo)跟蹤、場景建圖、軌跡預(yù)測、柵格預(yù)測和路徑規(guī)劃)整合到統(tǒng)一的端到端網(wǎng)絡(luò)框架下。
具體來說,將一系列多攝像頭圖像輸入特征提取器,并通過 BEVFormer 轉(zhuǎn)換為統(tǒng)一的鳥瞰圖(BEV)。這部分可以快速替換為其他BEV模型,具有較好可拓展性。
在感知環(huán)節(jié)中,UniAD的目標(biāo)檢測與跟蹤模塊可以實(shí)現(xiàn)對動態(tài)元素的特征提取、幀間物體跟蹤;在線建圖模塊實(shí)現(xiàn)了對靜態(tài)物體的特征提取、實(shí)例級地圖預(yù)測;
在預(yù)測模塊,UniAD可以實(shí)現(xiàn)動靜態(tài)元素交互與長時序軌跡預(yù)測;占據(jù)柵格預(yù)測模塊實(shí)現(xiàn)了短時序全場景BEV、實(shí)例級預(yù)測;
在規(guī)劃模塊,UniAD實(shí)現(xiàn)基于自車query的軌跡預(yù)測和基于占據(jù)柵格的碰撞優(yōu)化。
論文表示,UniAD 的培訓(xùn)分兩個階段:首先聯(lián)合訓(xùn)練感知部分,即目標(biāo)跟蹤和建圖模塊,這將持續(xù)幾個階段(在實(shí)驗(yàn)中為 6個階段),然后使用所有感知、預(yù)測和規(guī)劃模塊端到端地訓(xùn)練模型20個階段。
從結(jié)果來看,論文表示,在 nuScenes 真實(shí)場景數(shù)據(jù)集下,所有任務(wù)均達(dá)到領(lǐng)域最佳性能(State-of-the-art),尤其是預(yù)測和規(guī)劃效果遠(yuǎn)超之前最好方案。其中,多目標(biāo)跟蹤準(zhǔn)確率超越SOTA 20%,車道線預(yù)測準(zhǔn)確率提升30%,預(yù)測運(yùn)動位移和規(guī)劃的誤差則分別降低了38%和28%。
在晴天直行場景中,UniAD 可以感知左前方等待的黑色車輛,預(yù)測其未來軌跡(即將左轉(zhuǎn)駛?cè)胱攒嚨能嚨溃?,并立即減速以進(jìn)行避讓,待黑車駛離后再恢復(fù)正常速度直行 圖源上海人工智能實(shí)驗(yàn)室
在雨天轉(zhuǎn)彎場景中,即便面對視野干擾較大且場景復(fù)雜的十字路口,UniAD 能通過分割模塊生成十字路口的整體道路結(jié)構(gòu)(如右側(cè) BEV圖中的綠色分割結(jié)果所示),并完成大幅度的左轉(zhuǎn) 圖源上海人工智能實(shí)驗(yàn)室
從論文到產(chǎn)業(yè)還要多久?
當(dāng)然,從前瞻學(xué)術(shù)論文到產(chǎn)業(yè)跟進(jìn)、技術(shù)大規(guī)?;萜眨枰臅r間并不短。
以當(dāng)下被行業(yè)火熱討論的BEV為例。2021年特斯拉首次基于Transformer將攝像頭2D圖像拼接轉(zhuǎn)化成3D圖景,生成鳥瞰圖 “Bird"s Eye View”,簡稱“BEV”。這是大模型在自動駕駛感知環(huán)節(jié)的應(yīng)用。
兩年時間過去,當(dāng)下國內(nèi)企業(yè)雖已紛紛跟進(jìn),但僅有少數(shù)幾家能拿出先期成果。
而UniAD大模型是更為龐大的、涉及感知、預(yù)測、規(guī)劃的復(fù)雜系統(tǒng)工程,其中的技術(shù)優(yōu)化與工程化落地只會比BEV更艱難。
論文本身也指出,協(xié)調(diào)這樣一個具有多個任務(wù)的綜合系統(tǒng)并非易事,需要大量的計算能力,尤其是經(jīng)過時間歷史訓(xùn)練的計算能力。如何為輕量級部署設(shè)計和管理系統(tǒng)值得未來探索。
論文作者之一、上海人工智能實(shí)驗(yàn)室青年科學(xué)家李弘揚(yáng)博士表示,UniAD提供了全套關(guān)鍵自動駕駛?cè)蝿?wù)配置,其充分的可解釋性、安全性、與多模塊的可持續(xù)迭代性,是目前為止最具希望實(shí)際部署的端到端模型。這套基于視覺的全棧自動駕駛框架,據(jù)初步測算,每年節(jié)省激光雷達(dá)與標(biāo)注成本可達(dá)千萬級。
部分玩家已經(jīng)在行動。據(jù)36氪了解,小鵬和理想汽車都在籌備研發(fā)全棧端到端自動駕駛方案。“目前效果還不太好,但潛力很大?!庇袃?nèi)部人士透露。
總而言之,新的技術(shù)的種子已經(jīng)播下,行業(yè)新一輪競賽也可能已經(jīng)開始。接下來,就看誰能給出更肥沃的土壤與更恒久的耐心。
文章參考:
1.《Planning-oriented Autonomous Driving》
2.《AIR學(xué)術(shù)|上海人工智能實(shí)驗(yàn)室李弘揚(yáng)、陳立:端到端自動駕駛算法設(shè)計思考》
3.《上海AI實(shí)驗(yàn)室聯(lián)合團(tuán)隊獲CVPR最佳論文獎 | CVPR 2023》
關(guān)鍵詞:
責(zé)任編輯:文丨李安琪編輯丨李勤與自動駕駛相關(guān)文章,首次獲得全球頂級計算機(jī)視覺
北京市氣象臺今日6時發(fā)布:今天白天晴轉(zhuǎn)多云,山區(qū)有雷陣雨,東轉(zhuǎn)南風(fēng)
上海期貨交易所6月21日,廣東地區(qū)不銹鋼庫存424噸,較上日持平;江蘇地
1、一般在物理上把它翻譯成白噪聲(whitenoise)。2、白噪聲是指功率譜密
“抗癌斗士”成“無主尸體”。
人民網(wǎng)北京6月25日電(記者王連香)據(jù)交通運(yùn)輸部公眾號消息,6月22日至
想必現(xiàn)在有很多小伙伴對于我想知道度假型酒店和商務(wù)酒店的區(qū)別方面的知
文丨李安琪編輯丨李勤與自動駕駛相關(guān)文章,首次獲得全球頂級計算機(jī)視覺
九年磨利劍,今朝試鋒芒。6月24日,為期三天的2023年北京市初中學(xué)業(yè)水
考慮到現(xiàn)在的主動權(quán),完全掌握在姆巴佩及皇家馬德里手上,卡塔爾方面只
6月22日,正值端午假期,南京大報恩寺遺址博物館煥新傳統(tǒng)文化,融合流
今天給各位分享表情怎么畫的知識,其中也會對表情怎么畫簡單又漂亮進(jìn)行
3D感應(yīng)相關(guān)股票有哪些?3D感應(yīng)股票現(xiàn)在什么價格?(2023 6 25),3D感應(yīng)
雄安新區(qū)營造一流營商環(huán)境---經(jīng)濟(jì)日報石家莊6月24日訊(記者王勝強(qiáng))日
U19男籃世界杯第一比賽日正式打響,本屆小組賽中國隊和加拿大、法國、
中國隊不敵法國,前三節(jié)打得難解難分,末節(jié)崩盤,究竟是為什么?,崩盤,
在2023粵港澳車展上,保時捷911GT3RS實(shí)車首次公眾亮相,新車此前已公布
“東數(shù)西算”讓百姓生活更便捷中國甘肅網(wǎng)6月25日訊據(jù)蘭州日報報道(記
中新社北京6月24日電(記者阮煜琳)中國旅行社交平臺馬蜂窩24日發(fā)布的旅
IT之家此前報道,蘋果向AppleWatch用戶(S4及以上機(jī)型)推送了watchOS1
上一期我們說到了7月1日新國標(biāo)實(shí)施后,車外電子后視鏡CMS就可以合法合
1、在電腦中設(shè)置不隱藏文件擴(kuò)展名,然后對文件進(jìn)行重命名,修改其后綴
IT之家6月23日消息,中型純電SUV創(chuàng)維EV6II上市,指導(dǎo)價為15 68萬-28 98
當(dāng)?shù)貢r間24日,美國蒙大拿州斯蒂爾沃特縣發(fā)生一起火車脫軌事故,目前沒
燃情夏日!寧波文博奇妙夜之夏至音樂節(jié)熱力開唱
1、消息認(rèn)證的內(nèi)容不包括消息語義的正確性。2、消息認(rèn)證的內(nèi)容包括:證
北京市氣象臺今日6時發(fā)布:今天白天晴轉(zhuǎn)多云,山區(qū)有雷陣雨,東轉(zhuǎn)南風(fēng)
6月23日,梁靜茹2023當(dāng)我們談?wù)搻矍槭澜缪不匮莩獣蜿栒鹃_唱。
有的是舍不得投入真金白銀,在待遇和激勵機(jī)制上難以打動人才之心;有的
北京時間6月25日凌晨,乒乓球WTT突尼斯賽最后一場單打半決賽落下帷幕,
看看Forester、Outback和Crosstrek,外觀設(shè)計變化很小。斯巴魯在這個公
全球首臺16兆瓦風(fēng)機(jī)安裝工作全部準(zhǔn)備就緒
1、以前大學(xué)是設(shè)計專業(yè),老師分享的安裝包,破解純凈版,這里分享給你
六月的夏日充滿畢業(yè)季獨(dú)有的青春氣息,隨著中高考結(jié)束,“暑期檔”旅游
說想要一個張信哲的簽名李含在后臺見到了張信哲和兒子制作的小禮物贈送
據(jù)湖人隨隊記者DanWoike報道,消息人士透露,湖人與落選后衛(wèi)達(dá)米恩-鮑
新華社南京6月24日電題:滬蘇地鐵互通長三角核心城市深度同城化新華社
導(dǎo)讀:怎樣判斷機(jī)蓋更換原廠?以下由小編為大家?guī)斫榻B。首先可以觀察
盛夏時節(jié),走進(jìn)位于舟曲縣立節(jié)鎮(zhèn)東南部白龍江沿岸的拉尕山,草地如茵,
來源中國房地產(chǎn)報(記者苗野)“本次交易完成后,上市公司的業(yè)務(wù)領(lǐng)域?qū)?/p>
1、為加強(qiáng)新聞從業(yè)人員職務(wù)行為信息管理,維護(hù)新聞傳播秩序,推動新聞
假期上海接待游客逾672萬人次旅游消費(fèi)超96億元
科威特醫(yī)保醫(yī)院艾哈邁迪省分院病房。本報記者沈小曉攝科威特醫(yī)保醫(yī)院項(xiàng)
氣象專家:厄爾尼諾將給我國帶來哪些影響?
日前,我們發(fā)現(xiàn)新款吉利星瑞出現(xiàn)在了最新一期工信部申報目錄中。新車依
聊聊一篇機(jī)磷農(nóng)藥及常見毒物中毒救治手冊,對于有機(jī)磷農(nóng)藥及常見毒物中
明天全省都將升至30~33℃
6月8日,以“數(shù)創(chuàng)浪潮& 183;云聚灣區(qū)”為主題的天安云谷數(shù)字創(chuàng)意產(chǎn)業(yè)園
上海期貨交易所6月21日,廣東地區(qū)不銹鋼庫存424噸,較上日持平;江蘇地
中央氣象臺6月25日06時繼續(xù)發(fā)布高溫黃色預(yù)警:預(yù)計未來兩天,華北、黃
用人單位和我們勞動者簽訂的勞動合同一般都是有一定的時間期限的,一般
國家金融監(jiān)督管理總局網(wǎng)站近日發(fā)布的行政處罰信息公開表顯示,雪松國際
來源:中央廣電總臺央視新聞客戶端新華社芝加哥6月23日電(記者徐靜)
1、一般在物理上把它翻譯成白噪聲(whitenoise)。2、白噪聲是指功率譜密
新產(chǎn)品推廣活動,新產(chǎn)品推廣這個很多人還不知道,現(xiàn)在讓我們一起來看看
網(wǎng)絡(luò)聊天時使用表情符號,逐漸成為大家網(wǎng)絡(luò)社交聊天習(xí)慣,但表情使用不
新華社北京6月24日電(記者徐壯)文化和旅游部24日公布2023年端午節(jié)假
近日,北方多地遭遇高溫“炙烤”,37℃以上的高溫影響面積約45萬平方公
天津北方網(wǎng)訊:日前,市政府新聞辦召開“筑巢引鳳打造營商環(huán)境新高地”
對于職場人士而言,咖啡已經(jīng)成為日常工作生活中不可或缺的一部分,有的
掌上濟(jì)寧訊(記者徐斐)6月19日至21日,2023年山東省中小學(xué)教師合唱展
近日,北方多地遭遇高溫“炙烤”,37℃以上的高溫影響面積約45萬平方公
6月25日,北京高考成績將正式發(fā)布,考生可登錄北京教育考試院網(wǎng)站,輸
近日,索尼官方正式宣布,索尼與高通達(dá)成長期戰(zhàn)略合作協(xié)議,未來索尼新
近日,湖北省興山縣古昭公路沿線綠意蔥蘢。古昭公路是興山縣連接滬蓉
先后參建過廈門北站、哈爾濱西站、鶴壁東站、昆明南站等一批“地標(biāo)性”
火鍋是人們?nèi)粘I钪卸己芟矚g的美食,一家特色的火鍋品牌能夠給加盟商
近日,河北省張家口市沽源縣成立信訪心理服務(wù)中心,為城鄉(xiāng)來訪群眾提供
中國石化新聞網(wǎng)訊僅用2年時間,畢業(yè)不久的張順華就從一名實(shí)習(xí)加油員
多彩民俗點(diǎn)亮即墨古城---……前不久,青島市即墨區(qū)以“粽情飄香古城流
夏日深夜,位于越南北寧省的佳能工廠卻燈火通明,產(chǎn)線工人雙手一刻不停
中新網(wǎng)寧夏中寧6月24日電24日,《中國現(xiàn)代枸杞產(chǎn)業(yè)高質(zhì)量發(fā)展報告(2023
平野美宇在第一局比賽就沒有把握住關(guān)鍵分9:11輸?shù)袅?,第二局比賽高橋?/p>
認(rèn)知障礙是精神分裂癥的重要癥狀群之一,存在工作記憶、注意力、視覺和
展現(xiàn)你的才華,成果利市利民!廣州市政協(xié)全力打造的“百姓提案”征集平
章子怡帶著自己的女兒在北京柏悅酒店吃下午茶,被網(wǎng)友偶遇,于是便拍了下
理夫泉的護(hù)膚品怎么樣,理膚泉的護(hù)膚品怎么樣這個很多人還不知道,現(xiàn)在
1、你好這是地方語言特色,方言。2、原本是扛霸子。3、意思是大哥,帶
端午節(jié)假期安徽消費(fèi)市場平穩(wěn)有序
一位重慶的司機(jī)向鰲頭財經(jīng)吐槽:“雖然疫情過后這幾個月感覺行業(yè)有所回
1、載脂蛋白A的正常范圍為1-14mmol L,升高時通常是由動脈粥樣硬化性心
6月22日,北京故宮博物院游客撐傘、戴遮陽帽防曬。當(dāng)日,北京南郊觀象
喜報巴州區(qū)2023年高考中考再創(chuàng)佳績文科考生聶暢624分,勇奪全市第一。
經(jīng)常在外吃飯的人很熟悉小份菜。尤其點(diǎn)外賣時,一人食場景較多,小
導(dǎo)讀:調(diào)和漆可應(yīng)用于室內(nèi)外的木材、金屬等表面,能起到裝飾保護(hù)作用。
我們的生活當(dāng)中肯定有很多關(guān)于監(jiān)護(hù)人的事情,對于未成年人和沒有民事行
自成都出發(fā)前往泰國最大島嶼——普吉島游玩,變得越來越便利。6月23日
水利部24日發(fā)布汛情通報,6月20日以來,我國西南東部南部、江南、華南
1、《建筑設(shè)計手繪完全自學(xué)教程(第2版)》是2019年11月人民郵電出版社
中國石化新聞網(wǎng)訊 近日,集團(tuán)公司召開職工創(chuàng)新工作室建設(shè)推進(jìn)會,
乙木自坐祿根,生于食神生財?shù)奈煳缭?,得年柱癸卯生助,先天身財兩停?/p>
本次大會通過選舉產(chǎn)生了中國汽車工業(yè)協(xié)會車用電路系統(tǒng)分會第一屆理事會
每經(jīng)AI快訊,據(jù)亞馬遜消息,2023亞馬遜云科技中國峰會將于6月27日至28
目前故障已修復(fù),運(yùn)營秩序正在逐步恢復(fù)中。因此次延誤給您帶來的出行不
科創(chuàng)板機(jī)械概念股票有浙海德曼、綠的諧波、XD迪威爾等3家。根據(jù)南方財
青海新聞網(wǎng)·大美青??蛻舳擞嵱浾呓諒暮|市獲悉,為進(jìn)一步以法治化
2023年6月21日,銀川市興慶區(qū)富洋燒烤店燃?xì)獗ㄊ鹿拾l(fā)生后,銀川市公
全球首臺16兆瓦風(fēng)機(jī)的葉片和主機(jī)已經(jīng)抵達(dá)福建平潭外海風(fēng)電場的安裝地點(diǎn)
國內(nèi)首條跨省軌交系統(tǒng)無感換乘線路開通
中國山東網(wǎng)-感知山東6月23日訊(記者葛婷婷)日前,山東省教育廳官網(wǎng)發(fā)
1、原料:pr生成視頻、視頻字幕的文字版注意:word還是txt格式隨意,只
1、病情分析:這種現(xiàn)象稱為風(fēng)團(tuán),是蕁麻疹的特征性癥狀。2、蕁麻疹是人
IT之家6月24日消息,英偉達(dá)RTX30時代未在國內(nèi)推出公版顯卡,RTX40系列
據(jù)對全國流通領(lǐng)域9大類50種重要生產(chǎn)資料市場價格的監(jiān)測顯示,2023年6月