國內(nèi)科技大廠,在大模型競爭上再一次取得共識:既要做淘金者,也要賣鏟子。
進入4月份,阿里云一邊發(fā)布通用大模型“通義千問”,一邊致力于幫助其他企業(yè)打造專屬大模型。一位接近阿里云的人士表示,阿里云“甚至可以只賣鏟子”。
尚未公開內(nèi)測自有大模型產(chǎn)品的騰訊和字節(jié)跳動,也搶先盯上了賣鏟子的生意。
騰訊云發(fā)布了面向大模型訓(xùn)練的新一代HCC(High-Performance Computing Cluster)高性能計算集群,通過搭載英偉達最新H800 GPU,將整體性能提升了3倍。
字節(jié)更是明確表態(tài),火山引擎不做大模型,而是要為大模型客戶提供算力平臺,幫助其做好大模型開發(fā)。
在阿里、騰訊、字節(jié)相繼決定賣鏟子之前,百度其實是這一策略的更早提出者。但百度不同的是,前述大廠們都是在賣算力,百度更多是聚焦在服務(wù)。
在百度看來,支撐大模型訓(xùn)練和運轉(zhuǎn)的算力固然重要,但不是評判大模型優(yōu)劣的唯一標準。好的大模型需要由算力、框架、模型、應(yīng)用構(gòu)筑的四層架構(gòu)相互配合提供支撐,需要將模型開發(fā)、訓(xùn)練、調(diào)優(yōu)、運營等復(fù)雜過程封裝起來,為客戶提供低門檻、高效率的企業(yè)服務(wù)。
有百度內(nèi)部人士告訴字母榜,在率先發(fā)布國內(nèi)首個大語言模型文心一言后,3月底的一場閉門溝通會上,百度就推出了“既淘金又賣鏟子”的百度智能云大模型平臺,并在近期正式將其命名為“文心千帆大模型服務(wù)平臺”。
據(jù)字母榜了解,正在內(nèi)測的“文心千帆大模型平臺”,是全球首個一站式的企業(yè)級大模型生產(chǎn)平臺,不但提供包括文心一言在內(nèi)的大模型及第三方大模型服務(wù),還提供大模型開發(fā)和應(yīng)用的整套工具鏈,允許企業(yè)基于任何開源或閉源的大模型,開發(fā)自己的專屬大模型。
在賣鏟子上達成新共識后,頭部云廠商之間的大模型之戰(zhàn),開始深入AIGC+Application的軟件應(yīng)用開發(fā)。
這也是時下投資機構(gòu)最為青睞的方向之一。線性資本創(chuàng)始合伙人兼CEO王淮就表示,這是自己特別看重并且愿意花力氣去挖掘的領(lǐng)域。今年上半年,線性資本至少看了兩三百個基于大模型開發(fā)的各類應(yīng)用。
已經(jīng)走向全面開放或內(nèi)測階段的大模型產(chǎn)品提供商,由此掀起新一輪的應(yīng)用生態(tài)建設(shè)競賽。
OpenAI發(fā)布了ChatGPT Plugins插件功能,開始將大模型能力直連第三方應(yīng)用;微軟推出了AI版Office“全家桶”——Microsoft 365 Copilot,并將其測試企業(yè)數(shù)量從最初的20家,在近期擴展到600多家。
截至5月上旬,百度文心一言的內(nèi)測企業(yè)數(shù)量超過300家,并在400多個企業(yè)內(nèi)部場景取得了測試成效。
然而,目前企業(yè)應(yīng)用大模型仍面臨諸多難點,如模型體積大,訓(xùn)練難度高;算力規(guī)模大,性能要求高;數(shù)據(jù)規(guī)模大,數(shù)據(jù)質(zhì)量參差不齊。
隨著越來越多應(yīng)用與大模型相結(jié)合,其也將倒逼云廠商對自己的大模型服務(wù)體系進行升維,走向一條追求更好效果、更低成本的道路。
通過全棧自研體系的端到端整體優(yōu)勢,百度智能云在實現(xiàn)大模型訓(xùn)練成本降低的同時,做到大模型產(chǎn)品服務(wù)體驗的不掉隊,破除外界評判大模型優(yōu)劣時唯算力論的極端觀點。
百度集團副總裁侯震宇告訴字母榜,在接下來幾個月,百度大模型服務(wù)通過迭代優(yōu)化,還將實現(xiàn)大規(guī)模的成本下降,不僅算力不會成為阻礙,“價格應(yīng)該也不會成為大家所使用或者是擁抱大模型的瓶頸?!?/p>
01
“同樣60000字的文本回復(fù)量,一個人工客服,一天的成本在100元-200元,換用大模型智能助理,成本只有1塊錢?!睂⒋竽P彤a(chǎn)品引入客服體系進行內(nèi)測后,一家旅游行業(yè)業(yè)務(wù)負責(zé)人直觀感受到了大模型帶來的降本增效成果。相關(guān)產(chǎn)品未來會在完成安全評估后上線。
一些昔日垂類明星企業(yè),股價甚至被大模型直接沖垮。美國學(xué)生習(xí)慣用以搜索課堂作業(yè)答案的在線教育公司Chegg,成為全球首家公開承認“收入受ChatGPT影響”的公司,公司股價年內(nèi)跌幅接近60%。
網(wǎng)絡(luò)流量數(shù)據(jù)網(wǎng)站SimilarWeb給出的一份報告顯示,今年3月份GPT-4、微軟New Bing等產(chǎn)品陸續(xù)上線后,Chegg網(wǎng)站轉(zhuǎn)化訪問量同比暴跌89%。
對于企業(yè)來說,接入大模型產(chǎn)品已經(jīng)從一道選擇題,變成了必答題。
考慮到各行各業(yè)都有自己的Know-How,在遠望資本程浩看來,這正是頭部云廠商紛紛發(fā)力賣鏟子生意,幫助企業(yè)打造行業(yè)專屬大模型的動因之一。
但并不是每一家企業(yè)都需要從0到1,自主研發(fā)一個百億、千億的大模型產(chǎn)品。去年春節(jié)開始決定將辦公文檔引入大模型產(chǎn)品后,金山辦公就明確好了甲方心態(tài)——自己不做大模型,而是借助外部已有大模型方案,定制自己的專屬大模型。
在當前大模型尚缺乏評判好壞的統(tǒng)一客觀標準之下,如何在“百模大戰(zhàn)”中挑選出適合自己的大模型產(chǎn)品,正在成為企業(yè)面臨的一道新難題。
金山辦公助理總裁田然表示,公司的策略是要跟中國最好的大模型服務(wù)提供方站在一起,這勢必要求大模型技術(shù)提供商做到“人無我有,人有我優(yōu)”。
效果好不好,無疑會成為企業(yè)評判大模型產(chǎn)品好壞的首要標準。這一方面要看大模型產(chǎn)品是否已經(jīng)有了大規(guī)模應(yīng)用,如百度文心一言,已經(jīng)在內(nèi)部的百度搜索、百度新聞、百度地圖,小度智能屏、如流等等方面實現(xiàn)大規(guī)模落地,并籍此成為國內(nèi)唯一將大模型在實際應(yīng)用中大規(guī)模落地的公司。
另一方面還要看大模型是否足夠靈活便捷?;谖男那Х竽P推脚_,百度智能云提供公有云和私有云雙重部署方案,并分別配套有大模型推理、微調(diào)、托管,軟件授權(quán)、軟硬一體和租賃等多元化服務(wù)。
金山辦公由此看中了文心千帆在安全合規(guī)、模型深度、迭代速度、推理性能等多個方面的行業(yè)比較優(yōu)勢。目前,雙方在意圖理解、PPT大綱生成、范文書寫、生成待辦列表、文生圖等多模態(tài)生成場景上的聯(lián)合探索開發(fā),已經(jīng)取得了進展。
金山辦公CEO章慶元在接受采訪中提到,成本是打消公司自研大模型念頭的重要考慮因素?;诖?,運行成本成為企業(yè)評判大模型產(chǎn)品好壞的另一決定因素。
運行大模型有多少燒錢?從OpenAI身上就能略窺一二。近期,OpenAI被爆出去年虧損額翻倍,達到5.4億美元左右,主要都被用以支撐ChatGPT的運轉(zhuǎn)以及從谷歌挖人。
OpenAI CEO Sam Altman更是表示,OpenAI可能需要在未來幾年嘗試籌集多達1000億美元的資金,用來開發(fā)足夠先進的通用AI,同時維持公司的正常運轉(zhuǎn)。
在追趕OpenAI的道路上,后進者是否也要做好巨額虧損的準備?百度集團副總裁侯震宇向字母榜解釋道,“這或許說明微軟的云服務(wù)賣得太奢侈了。”
百度集團副總裁侯震宇
一個明顯的佐證是,2023年一季度,微軟云計算毛利率達到72%,而國內(nèi)云計算廠商大多還處于虧損階段。
為了降低用云成本,微軟、谷歌等美國頭部云廠商開始加速自研服務(wù)器芯片和云端AI芯片。
“如果你能制造出針對AI進行優(yōu)化的硅,那前方等待你的將是巨大的勝利。”研究公司Forrester分析師格倫·奧唐納形容道。
百度同樣也在推進旗下芯片自研計劃,其昆侖芯三代將對標更高性能的顯卡,有望在2024年量產(chǎn)。
值得注意的是,除了芯片層的成本優(yōu)化外,百度還是全球唯一一家在芯片層、框架層、模型層和應(yīng)用層具備全棧協(xié)同優(yōu)勢的云廠商。
借助端到端的整體優(yōu)化能力,在文心一言開啟內(nèi)測近兩個月以來,百度已經(jīng)對其進行了4次技術(shù)版本升級,并將大模型推理成本降至原來的十分之一。
在接下來幾個月,百度大模型服務(wù)通過端到端的迭代升級,還可以實現(xiàn)大規(guī)模的成本下降,“價格應(yīng)該不會成為大家所使用或者是擁抱大模型的瓶頸?!?/span>侯震宇表示。
通過百度過去近兩個月在大模型落地應(yīng)用上的實踐經(jīng)驗,侯震宇總結(jié)出了企業(yè)選擇大模型的三個標準評判:大模型本身的能力、大模型企業(yè)服務(wù)的能力、全棧技術(shù)積累程度。
02
持續(xù)不斷的AI創(chuàng)新和研發(fā)投入,無疑將成為支撐大模型效果和成本持續(xù)優(yōu)化的源動力。
但一則令A(yù)I創(chuàng)業(yè)者略感恐慌的消息卻在近期被證實。一度引領(lǐng)全球AI發(fā)展方向的谷歌,為了不再為他人作嫁衣,正式?jīng)Q定“以后將不得不推遲與外界分享自己的工作成果”。谷歌人工智能主管杰夫?迪恩對此表示,背靠微軟的創(chuàng)業(yè)公司OpenAI,正是在大量閱讀谷歌提交的AI論文基礎(chǔ)上,才做到了與谷歌保持同步。
令OpenAI火遍全球的ChatGPT,其中的T——Transformer,就是谷歌2017年在一篇AI論文中率先提出的概念。
在侯震宇看來,谷歌關(guān)閉基礎(chǔ)性AI研究的分享舉動,更多影響到的是那些在AI領(lǐng)域沒有自我積淀和獨特優(yōu)勢的公司。
當所有公司都無法再依靠谷歌來為自己辨明AI方向后,此舉反過來卻可能為國內(nèi)科技大廠創(chuàng)造出一個新的競爭優(yōu)勢。
近期,李彥宏在談及當下的大模型混戰(zhàn)中,就提到“算力不能保證我們能夠在通用人工智能技術(shù)上領(lǐng)先,算力是可以買來的,創(chuàng)新的能力是買不來的,是需要自建的?!?/p>
作為一款對標ChatGPT的產(chǎn)品,百度文心一言,背后包括有監(jiān)督精調(diào)、人類反饋的強化學(xué)習(xí)、提示、知識增強、檢索增強和對話增強等六大關(guān)鍵技術(shù)。
“前三項是這類大語言模型都會采用的技術(shù)……后三項則是百度已有技術(shù)優(yōu)勢的再創(chuàng)新,也是文心一言未來越來越強大的基礎(chǔ)?!卑俣菴TO王海峰解釋道,如通過知識增強,文心一言可以在調(diào)用更少參數(shù)的基礎(chǔ)上,達到效率更高、效果更好的目標。
這一創(chuàng)新優(yōu)勢同樣適合于企業(yè)借助文心千帆大模型平臺,通過數(shù)據(jù)微調(diào),打造自己的專屬大模型產(chǎn)品。
在5月9日的一場閉門交流會上,百度首次對外演示了如何微調(diào)行業(yè)專屬大模型的全過程。在文心一言基礎(chǔ)上,百度內(nèi)部測試了一款專屬大模型“文心問數(shù)”,希望來展示數(shù)據(jù)的可視化能力。這也是國內(nèi)第一個公開演示如何微調(diào)大模型。
在被要求其生成華北地區(qū)乃至全國2019年3月銷售額時,“文心問數(shù)”順利生成了餅狀圖等可視化圖標。
但在將難度升級,要求其生成“華北地區(qū)2019年3-5月的銷售額,用折線圖來表示”時,“文心問數(shù)”直接表示自己處理不了。