2023年開(kāi)年,ChatGPT迅速火遍全球,短短兩個(gè)月時(shí)間月活突破一億,成為被載入史冊(cè)的應(yīng)用之一。
ChatGPT的大火引發(fā)了全球科技巨頭的一場(chǎng)“軍備競(jìng)賽”,國(guó)內(nèi)的“中國(guó)版ChatGPT”爭(zhēng)奪戰(zhàn)也是一觸即發(fā)。
在國(guó)內(nèi)眾多大廠中,百度是最早做出明確表態(tài)的公司之一,2月初就正式宣布將在3月上線百度版ChatGPT“文心一言”,打響第一槍。
接下來(lái),華為、騰訊、阿里、京東云也都公布了自身在相關(guān)領(lǐng)域的布局情況,還有消息傳出稱字節(jié)跳動(dòng)的人工智能實(shí)驗(yàn)室(AI Lab)有開(kāi)展類似ChatGPT和AIGC的相關(guān)研發(fā)。
作為長(zhǎng)期關(guān)注AI賽道、走在第一線的VC/PE,對(duì)于AI大模型和“中國(guó)版ChatGPT”也保持著高度關(guān)注。我國(guó)什么時(shí)候才能擁有自己的“超級(jí)大腦”AI大模型?需要在哪些方面實(shí)現(xiàn)突破?目前面臨的挑戰(zhàn)又有哪些?
針對(duì)這些行業(yè)高度關(guān)注的熱門(mén)話題,《每日經(jīng)濟(jì)新聞》記者采訪了多位一級(jí)市場(chǎng)知名投資人。
VC/PE看好“中國(guó)版ChatGPT”:
一定會(huì)有自己的AI大模型
“未來(lái)國(guó)內(nèi)一定會(huì)有自己的AI大模型,并且也一定會(huì)誕生自己的ChatGPT?!痹谡劦酱蛟霢I大模型和“中國(guó)版ChatGPT”是否現(xiàn)實(shí)時(shí),多位投資人都對(duì)《每日經(jīng)濟(jì)新聞》記者做出了這樣的判斷。
創(chuàng)世伙伴資本合伙人聶冬辰進(jìn)一步解釋稱,中國(guó)擁有龐大的數(shù)據(jù),較強(qiáng)的模型開(kāi)發(fā)和算法優(yōu)化能力,大量?jī)?yōu)秀的AI工程師,具備打造中國(guó)版ChatGPT的條件,“當(dāng)然,這是一件長(zhǎng)期的事,涉及數(shù)據(jù)的收集清洗、算法的設(shè)計(jì)優(yōu)化等多個(gè)環(huán)節(jié),我們看到已經(jīng)有幾家公司在努力去做,但目前都處于比較早期的階段?!?/p>
對(duì)于中國(guó)能否做出自己的AI大模型,CMC資本董事總經(jīng)理易然也表達(dá)了自己的樂(lè)觀:“這完全是一個(gè)資源和時(shí)間的問(wèn)題,而且不會(huì)差太遠(yuǎn),我們之前和一些模型層的創(chuàng)業(yè)者、學(xué)者都有過(guò)交流,從技術(shù)的了解程度和人才儲(chǔ)備來(lái)說(shuō),我們其實(shí)并不差。此外,現(xiàn)在關(guān)于模型構(gòu)建方面的學(xué)術(shù)交流也很開(kāi)放和活躍,我們可以做一些參考。”
而在線性資本投資總監(jiān)白則人看來(lái),大模型這塊已經(jīng)不是什么秘密,因?yàn)殡m然Open AI的代碼沒(méi)有開(kāi)源,但是整個(gè)的構(gòu)建思路已經(jīng)通過(guò)論文的形式發(fā)出來(lái)了,大方向上已經(jīng)明確,只是在模型構(gòu)建和效果優(yōu)化方面的探索需要花費(fèi)大量時(shí)間,有大量工程化問(wèn)題要解決,并且訓(xùn)練成本也非常高。
“我覺(jué)得市場(chǎng)還需要多一些耐心。至少在AI大模型這一塊,做出來(lái)這個(gè)事大概率是沒(méi)有問(wèn)題的,我們判斷達(dá)到類似ChatGPT的效果差不多需要2~3年左右的時(shí)間”,白則人表示。
啟明創(chuàng)投合伙人周志峰則表示,他非常喜歡北京智源人工智能研究院理事長(zhǎng)張宏江所說(shuō)的一個(gè)比喻:過(guò)去的AI更多的是“大煉模型“,也就是說(shuō)每家科技公司都是各自獨(dú)立研發(fā)專用小模型;今天這一代的AI技術(shù),叫做“煉大模型”,底座模型是由某些特定的機(jī)構(gòu)研發(fā)出超大規(guī)模的通用模型,“這個(gè)模型不再是針對(duì)某一個(gè)專門(mén)應(yīng)用開(kāi)發(fā)的,它的訓(xùn)練數(shù)據(jù)是互聯(lián)網(wǎng)上能夠看到的所有數(shù)據(jù),數(shù)據(jù)也不需要做特別的標(biāo)注,訓(xùn)練也不需要監(jiān)督,做出來(lái)的是通用人工智能能力,然后第三方基于底座模型,針對(duì)千萬(wàn)個(gè)應(yīng)用場(chǎng)景去開(kāi)發(fā)軟件”。
他指出,從“大煉模型”到“煉大模型”的范式轉(zhuǎn)變,對(duì)AI未來(lái)十年、二十年的發(fā)展有重大意義。
挑戰(zhàn):
需要足夠的算力、模型工程化的人才和完整生態(tài)
國(guó)內(nèi)巨頭已經(jīng)紛紛入局,那么要做出ChatGPT這樣的現(xiàn)象級(jí)產(chǎn)品,目前還有哪些現(xiàn)實(shí)的挑戰(zhàn)擺在眼前呢?
易然坦言,國(guó)內(nèi)的公司此前在這個(gè)領(lǐng)域已經(jīng)有一些探索了,如果要達(dá)到類似ChatGPT的效果,還需要更多資源和時(shí)間的投入?!爱?dāng)然像芯片等方面可能會(huì)面臨一些阻礙,但是應(yīng)該也會(huì)有一些其他的解決方法。”他表示,未來(lái)會(huì)繼續(xù)關(guān)注模型層的演變,尤其是開(kāi)源對(duì)模型層帶來(lái)的影響,科技大廠在訓(xùn)練上取得了一些初步優(yōu)勢(shì)后可能通過(guò)開(kāi)源的方式去降維打擊。創(chuàng)業(yè)公司如何更好地利用開(kāi)源的模型,能否構(gòu)建出屬于自己垂直領(lǐng)域、更精細(xì)化的小模型也值得期待。
在白則人看來(lái),要做出國(guó)內(nèi)自己的AI大模型,最關(guān)鍵的要素是要有足夠的算力和模型工程化的人才。
“算力這塊可能會(huì)面臨卡脖子的問(wèn)題,而且除了硬件方面,可能還有一些比如說(shuō)計(jì)算框架層面這些軟件層面的問(wèn)題需要去解決。當(dāng)然我們也看到,中國(guó)的GPU近年來(lái)也在快速發(fā)展中,所以我覺(jué)得國(guó)內(nèi)的企業(yè)還是有實(shí)力可以去做的。”
聶冬辰也向《每日經(jīng)濟(jì)新聞》記者分析稱,構(gòu)建中國(guó)的AI大模型需要幾方面條件更加成熟:首先是底層技術(shù)能力,在模型構(gòu)建和訓(xùn)練方面要有持續(xù)大量投入,形成自己的中文語(yǔ)言大模型。其次,在數(shù)據(jù)方面,要有足夠體量的數(shù)據(jù)灌進(jìn)來(lái),對(duì)數(shù)據(jù)的收集、整理、清洗是一個(gè)非常龐大且耗時(shí)耗力的過(guò)程,需要有公司踏踏實(shí)實(shí)地能把這件事情做成。此外,整個(gè)市場(chǎng),無(wú)論是科技大廠、創(chuàng)業(yè)公司還是投資人,都需要有足夠的耐心,不投機(jī)、不跟風(fēng)?!叭绻覀冋娴哪艹料滦膩?lái),十年如一日地朝著自己的AI大模型方向去訓(xùn)練演進(jìn),肯定能做出來(lái)”。
而在談到關(guān)于中國(guó)在生成式AI和底座大模型的挑戰(zhàn)時(shí),周志峰指出,首先要面臨的就是算力問(wèn)題。由于算力成本非常高,怎么用國(guó)產(chǎn)的AI芯片進(jìn)行替代并降低成本,國(guó)產(chǎn)的AI芯片是不是能夠、什么時(shí)候能夠滿足大規(guī)模集群的算力、互聯(lián)帶寬、算法適配和協(xié)同的需求,都值得去觀察。
其次,過(guò)去一周很多人說(shuō)國(guó)內(nèi)的科技大廠和創(chuàng)業(yè)公司推出的大模型與ChatGPT是有代際差別的,我們落后了至少一代。在看Open AI的發(fā)展時(shí)會(huì)發(fā)現(xiàn),ChatGPT也好、GPT-3也好,是需要很長(zhǎng)時(shí)間研發(fā)積累的。
第三,更重要的是,目前圍繞著Open AI或者西方科技大廠的大模型已經(jīng)構(gòu)建出了一個(gè)初步的生態(tài),國(guó)內(nèi)科技大廠或者創(chuàng)業(yè)公司的大模型在技術(shù)和工程上,有很多的地方需要不斷追趕。“如果只是訓(xùn)練出大模型,沒(méi)有人去用,缺少完整生態(tài),也是沒(méi)有任何意義的?!?/span>
周志峰表示,“最后,我還是非常堅(jiān)定地看好生成式AI和大模型,它的出現(xiàn)標(biāo)志著一個(gè)巨大的AI開(kāi)發(fā)范式的轉(zhuǎn)換,將會(huì)真正的被利用到更多應(yīng)用場(chǎng)景。”