迅雷不及掩耳。
「暗涌waves」獲悉,AI創(chuàng)業(yè)公司Minimax正在以超十億美金的價格進行新一輪融資,該交易“正在交割過程中”。接近人士透露,“所有老股東都超額認購,而新股東大概有四五家”。此前,Minimax已完成兩輪融資,入局的投資方包括米哈游、高瓴創(chuàng)投、IDG資本、云啟資本、明勢資本等。
Minimax是目前大模型創(chuàng)業(yè)潮中估值最高的創(chuàng)業(yè)公司。除此之外,受到一級市場投資人關(guān)注的大模型公司還包括:王慧文的光年之外、智譜AI、楊植麟的新公司、沈向洋的新公司等。
除光年之外被《晚點LatePost》報道正在啟動第二輪融資、投前估值約10億美金外,據(jù)我們多方了解,其他公司的融資“也基本都有基金commit了”。
其中,Minimax和智譜AI分別成立于2021年和2019年,突出優(yōu)勢是“起跑早,已經(jīng)有相對成熟的大模型產(chǎn)品出來”,因而其估值相對更領(lǐng)先。
多位投資人表示,目前大模型創(chuàng)業(yè)的估值體系主要來自做成這件事需要的金額,以及團隊量級。
大模型產(chǎn)業(yè)鏈,可分為提供算力的基礎(chǔ)層、模型層和應(yīng)用層。目前創(chuàng)業(yè)公司機會主要集中在模型層和應(yīng)用層。其中大模型又分為像OpenAI 一樣提供API調(diào)取服務(wù)的通用大模型和基于開源大模型做微調(diào)的、差異化大模型。
一位投資人告訴我們,如果是做前一類的大模型,起步就需要5000萬美金。而如果想在市場有一定聲量,則需盡快拿到億美金級融資。而另一家投資機構(gòu)合伙人告訴「暗涌Waves」,通用大模型創(chuàng)業(yè),依賴重資源和強資金。無論投資人,還是創(chuàng)業(yè)者,都會是一個“少數(shù)人的游戲”。
多位投資人向「暗涌waves」表示,盡管多家公司的交易還在具體流程中,但市場普遍認為,面向通用大模型創(chuàng)業(yè)的窗口期已基本關(guān)閉,其首輪資本軍備賽也基本接近尾聲。
在一家美元基金投AI的合伙人看來,創(chuàng)業(yè)公司的機會往往在于大廠形成共識前入場。一旦大廠形成共識,除非王慧文量級的旗幟型選手,抑或后期有超強產(chǎn)品sense——可以定義超級產(chǎn)品者,否則很難以小搏大。而對VC們來說,盡管仍然有人因為相信這是比移動互聯(lián)網(wǎng)大十倍的機會,所以對估值上限容忍度很高,但多數(shù)投資人認為,“頭部的肯定已經(jīng)跟不動,其他的也要再觀望下”。
距離GPT4發(fā)布不過二十余天,中國的通用大模型創(chuàng)業(yè)已將迎來第一個賽點。
上牌桌的人
任何一次創(chuàng)投浪潮興起之初時涌現(xiàn)的領(lǐng)先者,未必是最后的冠軍。在千團大戰(zhàn)、共享出行時代,這一點已被數(shù)次證明。但很多人認為,鑒于大模型創(chuàng)業(yè)更高的技術(shù)門檻、以及不會更低的資金和資源需求,后來者居上、或者說源自無名之輩的故事可能性較低。
多位投資機構(gòu)合伙人告訴「暗涌Waves」,盡管如今大模型創(chuàng)業(yè)看起來風(fēng)起云涌,但實際上牌桌的不到10家,入局的VC機構(gòu)也鳳毛麟角,基本集中在美元基金。
這些公司大致可分為兩個派別:來自AI公司、大廠的創(chuàng)業(yè)派,以及來自高校、研究機構(gòu)的學(xué)院派。
在估值上跑得最快的是一直頗具神秘感的Minimax。它的核心團隊成員主要來自商湯科技、中科院、Uber等公司的AI團隊。
除此外,互聯(lián)網(wǎng)創(chuàng)業(yè)派還有王慧文的光年之外、搜狗創(chuàng)始人王小川的五季智能,前快手AI技術(shù)研發(fā)的核心人物李巖的元石科技、前京東AI掌門人周伯文的銜遠科技,以及李開復(fù)的Project AI 2.0等。
其中聲量最大的當(dāng)屬光年之外。在真格、源碼等基金入局后,「暗涌Waves」了解到,王興、五源等個人和機構(gòu)也參與其最新一輪投資中。
王小川的故事就更獨特一些。2021年,卸任搜狗CEO后,王小川一度沉迷在生命科學(xué)和醫(yī)學(xué)領(lǐng)域,并投出了小鹿中醫(yī)、DeepCare、熱心腸研究院等多家醫(yī)療公司。去年年中,他還在研究智能枕頭,但在2023年春節(jié)后,他火速決定奔赴大模型創(chuàng)業(yè)。
除此之外,還有原擔(dān)任京東集團副總裁、加拿大工程院外籍院士梅濤創(chuàng)辦的智象未來。目前智象未來已經(jīng)光速完成阿爾法公社領(lǐng)投、多位中科大知名企業(yè)家、AI大專家組團跟投的種子輪投資。
在“學(xué)院派”大模型創(chuàng)業(yè)者中,清華系一騎絕塵:出現(xiàn)了唐杰參與的智譜AI,楊植麟?yún)⑴c的循環(huán)智能、而豈凡超的深言科技,以及曾國洋的面壁智能,則是前不久王慧文試圖收購的兩家公司。
概括來說,清華系的NLP創(chuàng)業(yè)者主要來自三個脈絡(luò):唐杰和李涓子帶隊的知識工程實驗室(KEG)、孫茂松帶隊的自然語言處理與社會人文計算實驗室(THUNLP)以及朱小燕和其學(xué)生黃民烈?guī)ш牭慕换ナ饺斯ぶ悄埽–oAI)課題組。
在唐杰和李涓子這支脈絡(luò)下,誕生了智譜AI。GPT4發(fā)布同一天,唐杰在微博宣布:基于千億參數(shù)大模型的對話機器人ChatGLM,現(xiàn)在開啟邀請制內(nèi)測。而唐杰的學(xué)生,曾參與過華為“盤古”大模型研發(fā)的楊植麟,他的新公司同樣炙手可熱。
在「暗涌Waves」的采訪中,有投資人將楊植麟形容為:“有世界級科學(xué)家的視野,以及對技術(shù)路線的獨特嗅覺”。知情人士對我們表示,金沙江、今日資本、Coatue等機構(gòu)均對楊植麟的新公司表現(xiàn)出投資意向,甚至陸奇?zhèn)€人也將參與其中。
在國內(nèi)最早開展 NLP 研究的自然語言處理與社會人文計算實驗室(THUNLP)這條脈絡(luò)下,則誕生了孫茂松、劉知遠、深言科技的豈凡超以及面壁智能的曾國洋等人。
其中,孫茂松、劉知遠團隊研發(fā)的CPM模型,是智源研究院「悟道·文源」的前身。而深言科技的豈凡超以及面壁智能的曾國洋則是前不久王慧文試圖收購的兩家公司。
在交互式人工智能(CoAI)課題組脈絡(luò)下,朱小燕的學(xué)生黃民烈創(chuàng)立的聆心智能,在2022年就推出首個產(chǎn)品AI烏托邦,繼去年年底完成包括智譜AI在內(nèi)的數(shù)千萬元天使+輪融資后,前不久又宣布完成Pre-A輪融資。
除高校外,登上中國大模型創(chuàng)業(yè)牌桌的,還包括一些來自非營利性AI科研機構(gòu),尤其是在相關(guān)領(lǐng)域有深度積累的IDEA(粵港澳大灣區(qū)數(shù)字經(jīng)濟學(xué)院)和北京智源人工智能研究院的創(chuàng)業(yè)者。
其中,呼聲最高的,當(dāng)屬由IDEA研究院創(chuàng)始人沈向洋擔(dān)任顧問,IDEA認知計算與自然語言研究中心負責(zé)人張家興創(chuàng)立的新公司。在微軟押注OpenAI的GPT模型之后的2019年11月,微軟人工智能最高負責(zé)人沈向洋宣布離開微軟。而他在微軟通用人工智能模型的最后一個作品是聊天機器人小冰。
除此外,還有來自西湖大學(xué)工學(xué)院的藍振忠打造的西湖心辰,來自微軟亞洲研究院周明打造的瀾舟科技,其中前者前不久也完成新一輪數(shù)百萬美元的Pre-A輪融資。投資方包括百度風(fēng)投、凱泰資本和西湖教育基金會可持續(xù)發(fā)展平臺。
路徑與終局
對通用大模型創(chuàng)業(yè)公司來說,短期壓力主要來自Chatgpt4的發(fā)布和大廠的圍追堵截。
繼百度發(fā)布文心一言后,騰訊正在加速推進大模型“混元”,阿里則將在4月的云峰會上發(fā)布大模型進展,也有消息傳出,4月華為將發(fā)布對標(biāo)CHATGPT的盤古大模型,而6月,積累了大量c端圖片和視頻數(shù)據(jù)的字節(jié)跳動也要發(fā)布自己的大模型。事實上,不久前的3月22日,原阿里M6大模型的前帶頭人楊紅霞也已加入字節(jié)AI Lab(人工智能實驗室),參與語言生成大模型的研發(fā)。
在一家美元基金投AI的合伙人看來,創(chuàng)業(yè)公司的機會除了在大廠形成共識前入場外,還需要以非共識的方式破局。
在他看來,盡管目前OpenAI更多把自己定義成一個底層的提供模型服務(wù)的公司,但在已有“ChatGPT”這個MVP(最小可行性產(chǎn)品)后,它很可能既做模型去覆蓋很多垂直場景,也做一個C端產(chǎn)品,重新定義交互,拿到新的C端流量入口。
如果這件事發(fā)生,就意味著創(chuàng)業(yè)公司可以在新場景的搶奪中,擊破大廠目前的既有強勢場景優(yōu)勢,甚至出現(xiàn)創(chuàng)業(yè)公司和很多不同領(lǐng)域小巨頭合作的可能。
事實上,很多創(chuàng)業(yè)公司也開始放棄只做提供API服務(wù)的通用大模型方向,開始基于自己訓(xùn)練的大模型、或開源模型,甚至小模型,去創(chuàng)造自己的場景,并去做應(yīng)用類產(chǎn)品。
3月22日,王慧文在即刻發(fā)文招聘產(chǎn)品經(jīng)理。而幾天后,原搜狗輸入法產(chǎn)品經(jīng)理,被稱為“搜狗輸入法之父”的馬占凱宣布加入。之前有投資人認為,這或許是GPT4發(fā)布以及大廠進擊后,王慧文對團隊方向的調(diào)整。而據(jù)《晚點 LatePost》報道,王慧文創(chuàng)立的光年之外,搜狗前CEO王小川的新公司,都選擇同時做大模型和基于模型的應(yīng)用。
當(dāng)然,創(chuàng)業(yè)公司方向的選擇往往也與融資數(shù)額相關(guān)。華創(chuàng)資本投資人張金對暗涌Waves表示,做通用大模型的成本過高,一些拿錢少的公司很可能在后續(xù)中基于開源做有數(shù)據(jù)積累和用戶場景的小模型和其應(yīng)用。
而如果OpenAI最終沒有這樣一個C端產(chǎn)品出現(xiàn),一家美元基金投AI的合伙人,認為大廠與創(chuàng)業(yè)公司的競爭就會是另一種局面:要么出局,要么被收購兼并,要么就在細分領(lǐng)域小而美。
除場景外,創(chuàng)業(yè)公司與大廠的競爭主要來自數(shù)據(jù)、算法、算力幾個維度。在上述投資人看來,因為數(shù)據(jù)的核心不是數(shù)據(jù)量,而是數(shù)據(jù)質(zhì)量和工程化的能力,加上算法也能逐步追平,因此在數(shù)據(jù)和算法方面,創(chuàng)業(yè)公司和大廠并非不可一戰(zhàn)。
至于算力的搶奪以及成本的持續(xù)增高,他認為這將是大廠和創(chuàng)業(yè)公司共同的難題。
通常來說,1萬枚英偉達A100芯片是做好大模型的算力門檻,而處理1800億個參數(shù)的GPT3.5大模型,需要的GPU芯片數(shù)量可能是2萬枚。這是很多人認為只有云廠商才有資格下場大模型創(chuàng)業(yè)的原因之一。
但事實上,國內(nèi)云廠商擁有的GPU也主要是中低性能產(chǎn)品。在A100GPU被美國受限后,很多公司不得不使用“閹割版”的替代 A800。后者的數(shù)據(jù)因為傳輸速率低,內(nèi)存小,所以必然會影響到訓(xùn)練速度。
而隨著軍備競賽升級,創(chuàng)業(yè)公司能否搶到也是問題。有投資人告訴「暗涌Waves」,因為A100成為稀缺品,市面的價格開始水漲船高,從官方的1萬美元一枚,約合人民幣7萬,漲到8、9萬,甚至10萬一枚。
而對大廠來說,在后邊的從千卡到萬卡轉(zhuǎn)變中,也要面對整個系統(tǒng)架構(gòu)的巨大挑戰(zhàn)。何況除了算力成本,還有硬件采購成本、運營成本以及短期內(nèi)商業(yè)化的困難等等。一位在硅谷觀察頗久的美元基金投資人告訴「暗涌Waves」,“除非百億美金公司,否則很難跟進這個游戲?!?/p>
拾象是一家定位于全球科技投資的基金,也參與了部分海外大語言模型項目的投資。創(chuàng)始人廣密表示,短期內(nèi)這場AI競賽還將迎來幾個賽點:在模型層,關(guān)鍵節(jié)點之一即已上牌桌的選手第一輪融資官宣,意味著大模型首輪融資窗口期告一段落;其二,國內(nèi)第一個能力達到GPT3.5能力的自研大模型推出,并先占領(lǐng)開發(fā)者心智和生態(tài)。而在應(yīng)用層,關(guān)鍵節(jié)點則是“第一個殺手級應(yīng)用出現(xiàn)”,比如某個AI Native的應(yīng)用快速做出千萬級別的活躍用戶。
至于這場游戲的終局,大部分投資人認為“肯定是兩三家的寡頭競爭”。而上述美元基金投AI的合伙人則認為,拉到10年,它會比云計算行業(yè)的集中度更高,“中國市場可能就剩四五家”,但其中會出現(xiàn)至少一家“從底層芯片到C端應(yīng)用甚至是硬件機器人”完全打通AGI的“千億美金公司”。
上一篇:周鴻祎的又一個25年