①在非預(yù)設(shè)道路上,車輛能自行禮讓行人、避開路障、路口轉(zhuǎn)向、在兩條直行道中選擇一條車少的。②通過視頻訓(xùn)練數(shù)據(jù),AI可以自己學(xué)習(xí)駕駛;來自優(yōu)秀駕駛員的高質(zhì)量數(shù)據(jù),是訓(xùn)練特斯拉自動(dòng)駕駛的關(guān)鍵。③特斯拉即將上線一個(gè)新算力集群,其中包含1萬顆英偉達(dá)H100。
《科創(chuàng)板日?qǐng)?bào)》8月28日訊(編輯 鄭遠(yuǎn)方)正如之前承諾的一樣,馬斯克上周末用一輛搭載HW3的Model S,向外界直播展示了特斯拉FSD 12測試版。
在這場45分鐘的直播中,坐在方向盤后、舉著手機(jī)的馬斯克僅干預(yù)了一次車輛行為,車輛在非預(yù)設(shè)道路上,便能自行禮讓行人、避開路障、路口轉(zhuǎn)向、在兩條直行道中選擇一條車少的。
馬斯克表示,F(xiàn)SD 12可以在不熟悉的環(huán)境中離線使用;若有干預(yù)行為發(fā)生,系統(tǒng)會(huì)記錄并發(fā)回特斯拉分析。
而在直播開始后約20分鐘時(shí),馬斯克進(jìn)行了全程唯一一次干預(yù)接管。當(dāng)時(shí),這輛Model S需要直行,因此停下等待紅燈。但當(dāng)左轉(zhuǎn)信號(hào)燈轉(zhuǎn)綠時(shí),車輛竟然也緊跟啟動(dòng),好在馬斯克與一旁的工程師及時(shí)制止。
在這之后,馬斯克表示,要給FSD“投喂”更多左轉(zhuǎn)紅綠燈的視頻。
▌投喂視頻就能“喂”出“AI代駕”?
實(shí)際上,在這場直播中,當(dāng)車輛自行在減速帶減速、避開滑板車騎行者時(shí),馬斯克多次強(qiáng)調(diào),FSD 12中沒有任何一行相應(yīng)代碼,人為設(shè)定車輛作出這些動(dòng)作——其沒有被訓(xùn)練過如何讀取路標(biāo),也不知道什么是滑板車,FSD 12完成這些行為完全是大量視頻訓(xùn)練的結(jié)果。通過視頻訓(xùn)練數(shù)據(jù),AI可以自己學(xué)習(xí)駕駛,“像人類一樣做事”。
如果FSD在特定場景下沒有作出正確決策,特斯拉便會(huì)向其神經(jīng)網(wǎng)絡(luò)訓(xùn)練投入更多數(shù)據(jù)(主要是視頻)。
當(dāng)然,平庸隨意的數(shù)據(jù)是不夠的,供給神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)需要精心挑選。馬斯克也特別強(qiáng)調(diào),來自優(yōu)秀駕駛員的高質(zhì)量數(shù)據(jù),才是訓(xùn)練特斯拉自動(dòng)駕駛的關(guān)鍵。
“大量平庸的數(shù)據(jù)并不能改善駕駛,數(shù)據(jù)管理相當(dāng)困難。我們有很多軟件,可以控制系統(tǒng)選擇什么數(shù)據(jù)、訓(xùn)練什么數(shù)據(jù)?!?/p>
而對(duì)特斯拉而言,其數(shù)據(jù)的一大主要來源便是來自全球各地的車隊(duì)。馬斯克還透露,特斯拉在世界各地?fù)碛卸嗝鸉SD測試駕駛員,包括新西蘭、泰國、挪威、日本等。
從2020年起,特斯拉便開始將Autopilot決策從編程邏輯轉(zhuǎn)向神經(jīng)網(wǎng)絡(luò)與AI。經(jīng)過3年的發(fā)展,從本次馬斯克的FSD 12直播也能看到,幾乎整個(gè)決策與場景處理已轉(zhuǎn)移至特斯拉神經(jīng)網(wǎng)絡(luò)與AI上。
FSD 11獨(dú)占控制堆棧中有超過30萬行C++代碼,而12中代碼寥寥。之前馬斯克也曾指出,車輛控制(vehicle control)是“特斯拉FSD AI拼圖”上的最后一塊拼圖,其將使得這30萬行以上的C++代碼減少約2個(gè)數(shù)量級(jí)。
▌全AI端到端駕駛控制
特斯拉FSD 12是其最重要的一次升級(jí),實(shí)現(xiàn)了全AI端到端的駕駛控制。
至于為何選擇端到端方案?馬斯克直播之前與WholeMars連線時(shí),給出了更多細(xì)節(jié)。
“人類就是這么做的,”他表示,“光子輸入,手腳動(dòng)作(控制)輸出?!薄祟愐揽垦劬蜕锷窠?jīng)網(wǎng)絡(luò)開車,對(duì)于自動(dòng)駕駛而言,攝像頭與神經(jīng)網(wǎng)絡(luò)AI便是正確的通用決策方案。
雖說AI神經(jīng)網(wǎng)絡(luò)難以解釋具體細(xì)節(jié),但相應(yīng)地,人類乘客在打車時(shí),也無法準(zhǔn)確地知道司機(jī)在想什么,只能看到司機(jī)的評(píng)價(jià)。
券商指出,端到端方案與之前的關(guān)鍵區(qū)別之一就在于,傳統(tǒng)的模塊化架構(gòu)是將智能駕駛拆分稱單獨(dú)任務(wù),交由專門的AI模型或模塊來處理,例如感知、預(yù)測、規(guī)劃等;而端到端AI則是“感知決策一體化”,即將“感知”與“決策”融合到一個(gè)模型中。
目前,特斯拉絕大多數(shù)訓(xùn)練還是需要依靠英偉達(dá)的GPU,特斯拉自家的Dojo超算則是作為輔助。今年以來,特斯拉已為訓(xùn)練花費(fèi)了20億美元。
特斯拉還正在加班加點(diǎn),籌備一個(gè)新算力集群,其中包含1萬顆英偉達(dá)H100,有望在本周一(8月28日)上線。值得一提的是,該集群使用的是Infiniband進(jìn)行連接傳輸,馬斯克更坦言,如今Infiniband比GPU更缺。