美國時(shí)間1月28日周一早盤,美國科技股一片哀嚎,人工智能芯片領(lǐng)先供應(yīng)商英偉達(dá)股價(jià)直接暴跌12%。此外,Meta和 谷歌母公司 Alphabet,英偉達(dá)的競(jìng)爭(zhēng)對(duì)手 Marvell、還有博通、美光和臺(tái)積電也均大幅下跌。 造成美國股市哀鴻遍野的原因,是一款來自東方的"神秘AI應(yīng)用":DeepSeek。這款來自中國的AI產(chǎn)品,登頂了美國蘋果地區(qū)的免費(fèi)下載榜,一舉超越了AI巨頭ChatGPT!一時(shí)間,硅谷的所有從業(yè)者,紛紛坐立不安... DeepSeek打破了美國AI壟斷 DeepSeek是一家來自中國的開發(fā)開源大型語言模型的人工智能公司,總部位于浙江杭州。DeepSeek作為開源的大型語言AI模型,在最新發(fā)布的DeepSeek- R模型中,在僅有極少數(shù)標(biāo)注數(shù)據(jù)的情況下,極大提升了模型的推理能力。 目前在數(shù)學(xué)、代碼、自然語言推理,以及科學(xué)領(lǐng)域的測(cè)試中,性能比肩目前行業(yè)的領(lǐng)頭羊,OpenAI O1的正式版。這一結(jié)果不僅震驚了整個(gè)硅谷,更是讓美國政府苦心經(jīng)營的限制中國AI的策略落空。 從2022年的拜登政府,到如今的特朗普2.0,為了構(gòu)建美國AI科技領(lǐng)先的護(hù)城河,美國政府先后三次出臺(tái)芯片法案,切斷了中國獲得美國強(qiáng)大芯片的渠道,試圖限制中國AI技術(shù)的發(fā)展。例如英偉達(dá)公司的GPU H100型號(hào),原本被認(rèn)為是構(gòu)建AI模型競(jìng)爭(zhēng)力的關(guān)鍵產(chǎn)品,被禁止出口中國。但隨著DeepSeek的發(fā)布被徹底顛覆,美國在AI上進(jìn)行的芯片封鎖“政策破產(chǎn)”。 青出于藍(lán) 在很多AI基準(zhǔn)測(cè)試結(jié)果與Open AI不相上下的情況下,DeepSeek僅僅花費(fèi)了560萬美元,就完成了R1模型的訓(xùn)練,這讓硅谷的各家公司相當(dāng)震驚。要知道,行業(yè)領(lǐng)頭羊OpenAI每年的投入是50億美元,而背后的金主微軟則是投入了130億美元,谷歌在2024年度的報(bào)表中,更是豪擲了驚人的510億美元! DeepSeek可能是對(duì)美國股市的最大威脅,因?yàn)樵撃P鸵l(fā)了對(duì)數(shù)千億美元資本支出的效用的質(zhì)疑。“如果訓(xùn)練模型變得更便宜、更快、更容易,那么對(duì)使用AI的需求將增長(zhǎng)和加速得更快,這確保了計(jì)算的供應(yīng)將被使用。這也就有了開篇美國科技硬件和AI公司股票集體暴跌的一幕。 所以,DeepSeek是如何做到如此小的預(yù)算達(dá)成如此高的成就呢?這主要愿意DeepSeek的工程師們,利用強(qiáng)大的開源模型,讓開發(fā)者們跳過了自行構(gòu)建和訓(xùn)練模型。只需要在現(xiàn)有模型的基礎(chǔ)上,進(jìn)行自己模型的構(gòu)建。行業(yè)內(nèi)部的詞匯是“蒸餾”:即利用一個(gè)非常大的模型,來幫助你訓(xùn)練小模型,并在特定任務(wù)上表現(xiàn)更出色。 對(duì)此,OpenAI的創(chuàng)始人薩姆·奧特曼發(fā)文表示:“復(fù)制已有有效的事物相對(duì)容易,但在不確定任何前景的情況下,但嘗試新事物、冒險(xiǎn)和挑戰(zhàn)則是極其困難的?!痹捓镌捦猓瑠W特曼對(duì)于突然殺出來DeepSeek這個(gè)對(duì)手相當(dāng)不爽。 其實(shí),在AI領(lǐng)域中,所有的公司都是靠著互相模仿起家:Google建立了第一批大型語言模型,但是并未將其作為第一優(yōu)先級(jí),ChatGPT看到了機(jī)會(huì)后,抄襲了Google的想法迅速進(jìn)入這一領(lǐng)域。而當(dāng)ChatGPT成為行業(yè)領(lǐng)頭羊時(shí),谷歌,亞馬遜和Meta等公司紛紛入局, 同樣,DeepSeek也對(duì)于自己的來源沒有藏著掖著,當(dāng)對(duì)DeepSeek提問你是什么型號(hào)時(shí),DeepSeek會(huì)直接回答說,我是由OpenAI所創(chuàng)建的人工智能,架構(gòu)則是基于ChatGPT-4。不過,這絕非是簡(jiǎn)單的“站在巨人肩膀上”,而是青出于藍(lán)而勝于藍(lán)的故事。如今的DeepSeek,不僅是簡(jiǎn)單的模仿,而是通過創(chuàng)新進(jìn)行彎道超車。 DeepSeek與ChatGPT 最大的不同在于:DeepSeek R1是開源的,而 ChatGPT是閉源的。開源意味著開發(fā)者有著完全的訪問權(quán)限,而一旦開源軟件趕上甚至超越閉源軟件,所有開發(fā)者都將會(huì)轉(zhuǎn)向開源軟件。 這就給Open AI這樣的行業(yè)領(lǐng)頭羊敲響了警鐘,今天你們還是領(lǐng)跑者,明天就有可能被迎頭趕上! 美國硅谷的CEO們贊嘆不已 想知道自己做的到底怎么樣,要聽聽對(duì)手對(duì)你的評(píng)價(jià)。面對(duì)DeepSeek的突然崛起,微軟CEO薩提亞?納德拉在瑞士達(dá)沃斯論壇上表示:“DeepSeek 的新模型令人印象深刻,尤其是在如何高效開發(fā)開源模型并進(jìn)行推理計(jì)算方面。它的計(jì)算效率非常出色,我們應(yīng)當(dāng)非常、非常認(rèn)真地對(duì)待來自中國的這些技術(shù)進(jìn)展。” AI科技初創(chuàng)公司Scale AI創(chuàng)始人亞歷山大·王(Alexandr Wang)同樣在達(dá)沃斯論壇上,他表示,過去十年來,美國可能一直在人工智能競(jìng)賽中領(lǐng)先于中國,但DeepSeek的AI大模型發(fā)布可能會(huì)“改變一切”,尤其是在開源領(lǐng)域。 Meta創(chuàng)始人馬克·扎克伯格在一檔播客節(jié)目中表示,DeepSeek的大模型非常先進(jìn)。美國科技行業(yè)雖然暫時(shí)領(lǐng)先,但中國正在全力沖刺,兩者差距很小。而Meta已經(jīng)成立了四個(gè)專門研究小組來研究量DeepSeek的工作原理并基于此來改進(jìn)旗下大模型Llama。 小分隊(duì)1和2試圖搞清楚DeepSeek是如何降低訓(xùn)練和運(yùn)行成本的; 小分隊(duì)3負(fù)責(zé)研究DeepSeek可能使用了哪些數(shù)據(jù)來訓(xùn)練模型; 小分隊(duì)4正在考慮基于DeepSeek模型的屬性重組Meta模型的新技術(shù)。 Meta的惶恐并不意外,畢竟,當(dāng)部門里一個(gè)高管的薪資就超過整個(gè)DeepSeek V3的訓(xùn)練成本,而且這樣的高管還有幾十位,他們?cè)撊绾蜗蚋邔咏淮? 揭秘DeepSeek團(tuán)隊(duì) 而DeepSeek能取得今天的成就,絕非一日之功,同樣是經(jīng)歷了多年的努力和“孵化”。創(chuàng)始人梁文峰來自浙江大學(xué),擁有信息與電子工程學(xué)系本科和碩士學(xué)位。從2008年起,他就開始帶領(lǐng)團(tuán)隊(duì)使用機(jī)器學(xué)習(xí)等技術(shù)探索全自動(dòng)量化交易。不過直到2023年7月,DeepSeek才算是正式成立,進(jìn)軍通用人工智能領(lǐng)域,且至今也未對(duì)外進(jìn)行融資。 面對(duì)如此神秘的公司,前OpenAI政策主管、如今Anthropic聯(lián)合創(chuàng)始人Jack Clark認(rèn)為,DeepSeek雇用了“一批高深莫測(cè)的奇才”。不過,梁文峰在接受采訪時(shí)曾透露,這里沒有什么高深莫測(cè)的奇才,不過都是來自Top高校的畢業(yè)生、包括尚未畢業(yè)的博四、博五實(shí)習(xí)生,還有一些畢業(yè)不久的年輕人。 DeepSeek團(tuán)隊(duì)最大的特點(diǎn)是名校、年輕,即使是團(tuán)隊(duì)Leader級(jí)別,年紀(jì)也多在35歲以下。不到140人的團(tuán)隊(duì),工程師和研發(fā)人員幾乎都來自清華大學(xué)、北京大學(xué)、中山大學(xué)、北京郵電大學(xué)等國內(nèi)頂尖高校。 作為AI公司的創(chuàng)始人,梁文峰也曾被問到關(guān)于錢夠不夠的問題:怎么看待做量化同時(shí)做大量基礎(chǔ)研發(fā),不燒錢嗎?對(duì)此他的回答是:一件激動(dòng)人心的事,或許不能單純用錢衡量。就像家里買鋼琴,一來買得起,二來是因?yàn)橛幸蝗杭庇谠谏厦鎻椬鄻非娜恕? 中美之間的AI競(jìng)爭(zhēng)剛剛開始 2011年,馬斯克在接受媒體采訪時(shí),主持人問了他一個(gè)問題,如何看看待中國比亞迪?馬斯克聽完后,不僅哈哈大笑,隨后還反問道,你見過比亞迪的車輛嗎?我不認(rèn)為比亞迪有什么好的產(chǎn)品!時(shí)間推到2023年時(shí),有網(wǎng)友把這段舊視頻翻出來后,馬斯克大方承認(rèn)了自己當(dāng)年的錯(cuò)誤。他說,這是很多年前的事兒了,如今他們的汽車很具競(jìng)爭(zhēng)力。 這樣的狀況,又一次出現(xiàn)在AI的領(lǐng)域中。一年半前,谷歌的前CEO埃里克·施密特曾說過,中國的人工智能領(lǐng)域落后美國兩到三年。但到了本周ABC電視臺(tái)《This Week》節(jié)目上,這位前CEO改了口“在過去的六個(gè)月里,中國以驚人的速度迎頭趕上?!? 喬治梅森大學(xué)(George Mason University)AI研究員迪恩·鮑爾 (Dean Ball)認(rèn)為,這一趨勢(shì)表明,中國開發(fā)團(tuán)隊(duì)正在迅速接近前沿技術(shù)水平。他指出,DeepSeek的小型版本R1能夠在普通家庭電腦上運(yùn)行,這將有助于推動(dòng)AI應(yīng)用的快速普及:“DeepSeek小型模型的卓越性能意味著強(qiáng)大的推理系統(tǒng)會(huì)迅速傳播,并能在本地硬件上運(yùn)行——遠(yuǎn)離任何集中監(jiān)管(包括美國的出口管制)的視線。” 如今的美國,正計(jì)劃大舉砸錢投入AI基礎(chǔ)設(shè)施。就在上周,美國新任總統(tǒng)特朗普宣布OpenAI、甲骨文、軟銀將成立一家合資企業(yè)“星際之門項(xiàng)目”,未來四年斥資5000億美元(約合人民幣3.6萬億元)建設(shè)新的AI數(shù)據(jù)中心。特朗普的人工智能“沙皇”薩克斯表示,DeepSeek“表明人工智能競(jìng)賽將非常具有競(jìng)爭(zhēng)力,美國人能自信但不能自滿。 中國AI公司證明了用有限的計(jì)算資源,足以做出頂尖水平的模型。DeepSeek R1正在改寫AI游戲規(guī)則。隨著更多的中國AI公司通過開源和低價(jià)模型的進(jìn)入,這場(chǎng)中美之間的AI競(jìng)爭(zhēng)大戲,才剛剛開始... 美國大廠慌了?美國人看就是幸災(zāi)樂禍! 小王再次邀請(qǐng)?jiān)谥袊盍司拍?,現(xiàn)居華盛頓的資深英語老師馬思瑞馬老師(Chris),根據(jù)每篇文章內(nèi)容分享一些英語常用詞匯,讓大家了解英語新聞里的地道表達(dá),以及一個(gè)美國人對(duì)當(dāng)?shù)匦侣劦恼鎸?shí)看法,努力打破信息差。 01 馬老師有話說 DeepSeek is now the #1 most-downloaded app on the Apple App Store, and Western social media is blowing up with discussions about who’s better and how Big Tech is doomed (完蛋了)! I’ve seen people saying that you shouldn’t use DeepSeek because it’s Chinese, but it seems like many U.S. netizens (網(wǎng)民) really don’t care. Just like we‘ve seen with other Chinese apps lately… DeepSeek成為蘋果app商店下載量最多的app之后,西方社交媒體的討論真是炸了。大家都在討論哪個(gè)(AI模型)是最好的、說大科技公司完蛋了。我看有人說因?yàn)镈eepSeek是中國的公司,所以我們美國人不應(yīng)該用它,但是看來很多美國網(wǎng)友真不在乎。就跟最近其他的中國app火起來一樣... “Look, it’s a tool in the toolbox. You find which tool works for your particular needs and you use it.” The idea seems to be that loyalty doesn’t exist to any specific app. They just want to use the BEST app for their goals. “我跟你說,只是工具箱里的一個(gè)工具。你看哪個(gè)工具最符合你具體的需求,然后就用它”。網(wǎng)上的很多討論反映出大家不對(duì)任何app忠誠。他們只想用最能幫他們達(dá)到目標(biāo)的app。 And, yeah, stocks did plummet (狂跌) today, but with the state of the U.S. economy, many people have zero sympathy for tech companies that haven’t prioritized Americans‘ interests anyway. 反正確實(shí)今天很多股票狂跌了,但是考慮到美國經(jīng)濟(jì)的現(xiàn)狀,很多人根本不同情那些沒有把保護(hù)美國人的利益放在第一位的(美國)科技公司。 U.S. tech companies have been trying to hiring more people overseas because they can pay less money. So for many Americans who are impacted by those policies, this is a “schadenfreude” (幸災(zāi)樂禍) moment. 很多美國科技公司一直想在海外雇更多人,因?yàn)檫@樣不用付那么高的工資。所以對(duì)于那些受到該政策影響的美國人來說,這就是個(gè)幸災(zāi)樂禍的時(shí)刻。 “(Tech companies) spent years sending your jobs (overseas) and are working on an attempt to replace the remaining jobs, (then) get mad at us for using a Chinese version that will financial hurt them.” “(科技公司)花好幾年把我們的工作送到國外去了,而且還繼續(xù)想辦法看看怎么取代剩下的美國員工... 現(xiàn)在大家開始用一個(gè)中國的競(jìng)品,那些公司發(fā)現(xiàn)要虧錢了就生我們的氣?” I’ve seen a lot of people bring up “FAFO,” which means “f*** around and find out.” This idea is actually very similar to 不作死就不會(huì)死. 我還看到不少人提到FAFO,意思就是f*** around and find out。這個(gè)短語的意思跟“不作死就不會(huì)死”還挺類似。 Another great phrase here is “You reap what you sow” (種瓜得瓜,種豆得豆). 另外一個(gè)特別好的短語就是you reap what you sow,就是種瓜得瓜,種豆得豆。 Like Bingru mentioned above, people definitely are concerned about an AI (人工智能) bubble (泡沫) bursting, since DeepSeek proves that you can achieve pretty amazing results with much smaller budgets. 像冰汝提到的,確實(shí)有不少人擔(dān)心人工智能泡沫已經(jīng)爆了,畢竟DeepSeek證明了小預(yù)算還能獲取驚人的成果。 That’s probably why NVIDIA’s stock plummeted today. But, honestly, I think everything is just going to lead to more efficient uses of tech to train even better models. 這應(yīng)該也是為什么英偉達(dá)的股票今天狂跌。但是說實(shí)話,我覺得最終的結(jié)果應(yīng)該就是大家可以用這些科技來更高效地訓(xùn)練更厲害的模型。 Personally, I agree with the people that see AI as a tool. If all these tools can make our lives easier and our work more efficient, I’m all for it. 對(duì)我個(gè)人而言,我還是同意那些人的說法,人工智能是個(gè)工具。如果這些工具能讓我們的生活變得更方便、讓工作更有效率,那我完全支持。