香蕉在线视频网站,国产视频综合,亚洲综合五月天欧美,成人亚洲综合,日本欧美高清全视频,国产视频黄色,欧美高清在线播放

當自動駕駛遇上大模型 機器人加速“直立行走” 這些零部件成未來降本關(guān)鍵

《科創(chuàng)板日報》6月17日訊(編輯 鄭遠方)說起AI技術(shù),自動駕駛與大模型是兩大重要議題。而在“AI熱潮”催化之下,作為AI關(guān)鍵載體之一的機器人將這兩條主線匯聚至一處,指向了AI下一個浪潮“具身智能”,即能理解、推理、并與物理世界互動的智能系統(tǒng)。

  特斯拉不久前披露Optimus人形機器人最新進展,機器人展現(xiàn)出不帶輔助的行走能力,且能精準做到電機轉(zhuǎn)矩控制,產(chǎn)品力的進步也被看作產(chǎn)業(yè)化漸近的信號。值得注意的是,Optimus內(nèi)置FSD芯片、與汽車共用AI系統(tǒng),畢竟正如馬斯克所說,“我們的汽車差不多算是有輪子的半感知機器人?!?/p>

  與此同時,相繼面世的大模型則進一步賦予了機器人更智慧的“大腦”與“感官”

  例如Meta的SAM(Segment Anything Model)模型可分割圖像中的一切對象,向多模態(tài)更進一步的同時,一舉突破了機器視覺底層技術(shù);還有谷歌聯(lián)合柏林工業(yè)大學(xué)團隊發(fā)布的“史上最大‘通才’AI模型”PaLM-E,只需要一句簡單指令,便可實現(xiàn)更為自主的機器人控制,使得機器人的行動不再需要仰賴人類的手寫指令與代碼。

  可以看到,這場由ChatGPT引起的“AI狂歡”中,技術(shù)大跨步邁進的,并不只有能在線上與用戶自由交流的聊天機器人,更有線下能與現(xiàn)實世界切實交互的實體機器人們——此番熱潮賦予了后者更聰明的大腦、更敏銳的眼睛以及更具行動能力的軀體

  ▌特斯拉“擎天柱”:站在機器人、AI、自動駕駛的交匯點

  在人形機器人行業(yè)中,特斯拉的Optimus(擎天柱)可以說得上是行業(yè)“領(lǐng)頭羊”。

  特斯拉研發(fā)人形機器人的初衷,便是最大程度上利用特斯拉在造車和自動駕駛方面的優(yōu)勢,特別是自動駕駛研發(fā)過程中積累的算法經(jīng)驗、數(shù)據(jù)驅(qū)動能力、AI芯片能力、模型訓(xùn)練能力等。開源證券指出,智能是特斯拉投入機器人領(lǐng)域最核心的競爭力。

  人形機器人與特斯拉自動駕駛汽車都遵循“感知-認知-決策-執(zhí)行”運行邏輯。而正如上文提到的,特斯拉機器人與汽車共用FSD系統(tǒng)。該系統(tǒng)由數(shù)據(jù)、算法、硬件構(gòu)成整體架構(gòu),其迭代路徑則是通過不斷升級算力的硬件來支撐不斷升級的算法,從而處理不斷增加的海量數(shù)據(jù)。

  其中,分析師指出,數(shù)據(jù)方面,特斯拉FSD系統(tǒng)已有海量數(shù)據(jù)儲備,開發(fā)人形機器人可節(jié)省大量前期費用。

  感知方面,特斯拉FSD系統(tǒng)擁有非常強大的純視覺感知方案,特斯拉已引入Occupancy Network,與激光雷達相比,其視覺的語義感知能力更強。對于成本控制更加嚴格的人形機器人而言,類似Occupancy Network的方式優(yōu)于激光雷達解決方案。

  規(guī)劃和控制方面,特斯拉“交互搜索”規(guī)劃模型進一步增強了FSD系統(tǒng)的規(guī)控能力,且FSD系統(tǒng)還能通過Occupancy Network對可視區(qū)域進行建模,以處理未知不可見場景。

圖|特斯拉Optimus復(fù)用Occupancy Network感知網(wǎng)絡(luò)圖|特斯拉Optimus復(fù)用Occupancy Network感知網(wǎng)絡(luò)

  ▌人工智能與機器人相輔相成

  大模型可通過將圖像、文字、具身數(shù)據(jù)聯(lián)合訓(xùn)練,引入多模態(tài)輸入,進而提升大模型和環(huán)境的交互能力和學(xué)習(xí)能力,推動機器人向更智能、靈活和自主的方向發(fā)展。

  人工智能是機器人實現(xiàn)智能化的關(guān)鍵,而與此同時,對于人工智能技術(shù)而言,機器人則是重要落地場景。如廣發(fā)證券指出的,人形機器人作為具象的實體,是AI絕佳載體。

  一方面,機器人、特別是人形機器人能豐富AI的表現(xiàn)方式。除了傳統(tǒng)的語音交互、圖片交互,人形機器人也為AI帶來了更多的交互方式,包括表情、手勢等,極大延展了AI的表達領(lǐng)域。

  另一方面,機器人也承擔起了AI輸出窗口的作用。

  以英國機器人公司Engineered Arts研發(fā)的一款類人型機器人Ameca為例,除了與人類相像的外表,其最重要的功能便是為各種AI技術(shù)提供了一個真實的平臺。用戶可以根據(jù)需要,從庫中快速加載預(yù)先保存的姿勢、聲音、動畫和子序列,只需使用計算機鼠標或觸摸板,單擊并拖動機器人的功能,就能實現(xiàn)豐富的面部表情。

  ▌機器人降本“三步走” 哪些環(huán)節(jié)扮演關(guān)鍵角色?

  邁過實驗室技術(shù)積累階段,機器人行業(yè)正逐漸邁向具身智能時代。產(chǎn)業(yè)鏈各環(huán)節(jié)的技術(shù)進步推動者機器人產(chǎn)業(yè)不斷向前,而整體行業(yè)的擴張也為產(chǎn)業(yè)鏈打開了更廣闊的的空間。

  機器人關(guān)鍵技術(shù)可分為AI技術(shù)與傳動技術(shù),其中廣發(fā)證券指出,運動模塊硬件等非核心傳動部件并非是機器人公司專長,外購概率較高

圖|機器人關(guān)鍵技術(shù)分類(來源:廣發(fā)證券)圖|機器人關(guān)鍵技術(shù)分類(來源:廣發(fā)證券)

  機器人龍頭之一的波士頓公司因缺乏合適供應(yīng)商而“被迫”自研伺服閥,公司曾公開表示,作為機器人公司并不想自研伺服閥,公開尋求供應(yīng)商。

  因此分析師也猜測稱,攝像頭和算法等核心部件,特斯拉將進行汽車供應(yīng)商平移或自制供應(yīng);而對于減速器、伺服等技術(shù)要求較低的驅(qū)動部件,或?qū)で笸獠抗?yīng)。

  而開源證券補充稱,特斯拉機器人關(guān)節(jié)執(zhí)行器采用的零部件種類和現(xiàn)有工業(yè)機器人基本一致,只需根據(jù)人形機器人特點對零部件進行調(diào)整修改,就可進行標準化量產(chǎn),且軸承、齒輪箱、滾珠絲杠、電機等部件可復(fù)用特斯拉汽車供應(yīng)鏈。

  再次以特斯拉Optimus為例,這一機器人具體有哪些零部件?券商列出了具體零部件名單與相關(guān)標的。

 ?。?)旋轉(zhuǎn)關(guān)節(jié):無框力矩電機、諧波減速器和力矩傳感器是價值量占比最高的零部件,降價空間最大的為無框電機(降價75%)、諧波減速器(降價75%)、角接觸軸承(降價64%)。

  (2)線性關(guān)節(jié):是特斯拉機器人在硬件端優(yōu)化升級的核心。行星滾柱絲杠、倒置滾柱絲桿價值量占比,行星滾柱絲杠在特斯拉機器人硬件總成本中占比也最高。兩者相比早期階段,降價空間分別達到93%、95%。

 ?。?)靈巧手:內(nèi)部構(gòu)成是一個微型線性執(zhí)行器(伺服電缸)。國產(chǎn)廠商在除了減速箱以外的其他零部件領(lǐng)域均處于量產(chǎn)的布局期,能夠率先實現(xiàn)微型線性執(zhí)行器量產(chǎn)的企業(yè)將通過規(guī)模效應(yīng)大幅降本。

 ?。?)加工設(shè)備:磨床和齒輪加工機床是減速器、軸承、滾珠絲杠、電機在精加工階段的重要設(shè)備。國內(nèi)秦川機床、寧江機床、北平機床已具備批量生產(chǎn)高精度齒輪加工設(shè)備的能力。

 ?。?)其他零部件:特斯拉人形機器人電池實現(xiàn)小體積大容量,推測復(fù)用汽車動力電池技術(shù)。視覺傳感器硬件為左右單目相機+魚眼相機,硬件成本較低,依賴算法。集成汽車視覺傳感技術(shù),工廠等部分場景有應(yīng)用GPS傳感器。

  數(shù)據(jù)顯示,目前Optimus硬件成本占BOM表比例超過50%,要達到2萬美元售價還有84%的降價空間。對比當前時點和終局狀態(tài)下BOM表拆解,開源證券指出,線性關(guān)節(jié)和靈巧手的降本空間最大

  總體而言,目前人形機器人成本約為 10-15 萬美元左右。優(yōu)必選預(yù)測,根據(jù)量產(chǎn)規(guī)模不同,人形機器人降本進程大致分為3個階段

幾千臺小批量生產(chǎn),降本20%-30%至約10萬美元;

1萬-幾萬臺量產(chǎn),降本50%至5萬美元;

幾十萬至上百萬臺大規(guī)模量產(chǎn),降本70%-80%至2-3萬美元。

  ▌結(jié)語

  總體而言,AI大模型與人形機器人的相輔相成,邁出了通向通用人工智能的一大步。

  國泰君安指出,服務(wù)機器人商業(yè)化落地的前提是產(chǎn)品能提供真實價值,而真實價值的判斷在于機器人能否通用。將機器人做成人形,便是為了使機器人的執(zhí)行能力更加通用。

  伴隨著自動駕駛技術(shù)的高速發(fā)展,人形機器人在視覺、SLAM與基礎(chǔ)AI上有了更多方案選擇。分析師預(yù)計,大模型的出現(xiàn),會從語音、視覺、決策、控制等多方面實現(xiàn)同人形機器人的結(jié)合,形成感知、決策、控制閉環(huán),機器人產(chǎn)業(yè)有望進入滲透率快速提升的新階段。