此前一直被看作是“ChatGPT概念股”的知乎,終于做出了自己的大模型。在日前舉行的“2023知乎發(fā)現(xiàn)大會”上,知乎方面公開了與面壁智能共建的大模型產(chǎn)品“知海圖AI”,而雙方的合作則將以聯(lián)合研發(fā)與戰(zhàn)略投資的方式展開。據(jù)悉,目前該大模型的首個功能“熱榜摘要”已啟動內測,其將對知乎熱榜上的問題回答進行抓取、整理和聚合,并把回答梗概展現(xiàn)給用戶。
作為一個在toC內容平臺上線的大語言模型項目,“知海圖AI”是基于清華NLP實驗室和面壁智能CPM-Bee(10B)模型的技術支撐。按照官方的說法,針對知乎熱榜問題中的所有回答,在“熱榜摘要”這個特定場景中將“知海圖AI”大模型的效果與GPT-4進行比較發(fā)現(xiàn),兩個模型的表現(xiàn)幾乎持平。
要知道,在王小川眼中,國內目前的大模型與GPT的差距是三年,即使樂觀如李彥宏也只是喊出了,“百度的文心一言和OpenAI的差距是2個月”。而到了知乎這里,知海圖AI就敢說與GPT-4在特定場景能戰(zhàn)成平手了。
從某種意義上來說,知乎方面似乎是學習了手機廠商的“好榜樣”,畢竟只要定語加的足夠多,誰都能成為“第一”。在許多業(yè)內人士看來,對于知乎而言,將“知海圖AI”的首秀放在知乎熱榜是恰到好處的,畢竟要是去拼技術底蘊、拼應用范圍,它可能不是百度文心一言、阿里通義千問的對手。
事實上,知乎入局大語言模型賽道,加入“百模大戰(zhàn)”幾乎是一種必然。如今在移動互聯(lián)網(wǎng)紅利近乎于枯竭的環(huán)境下,未來無疑是混沌的,因此抓住可能通往未來的船票就成為了互聯(lián)網(wǎng)廠商擁抱變化的必然。用大語言模型來變革業(yè)務層、為具體的業(yè)務落地場景賦能,這也已經(jīng)是諸多互聯(lián)網(wǎng)廠商的共同策略。并且在當下這個存量市場中,在效率上的些許變化就已經(jīng)能兌現(xiàn)為競爭優(yōu)勢。
當下做大語言模型已經(jīng)不僅僅是追趕潮流,更是內容平臺屬性突出的知乎,保持市場競爭力的一種方式。無論老用戶如何吐槽,知乎依舊還是目前國內互聯(lián)網(wǎng)中數(shù)一數(shù)二的優(yōu)質內容平臺。君不見,微軟集成了ChatGPT的New Bing在回答用戶問題時,參考資料大量來源于知乎,由此也足以證明知乎的內容質量已經(jīng)受到了海外科技巨頭的認可。
要知道,ChatGPT這類大語言模型之所以比以往的人工智能產(chǎn)品更加智能,靠的就是“力大磚飛”,也需要海量的語料庫做支撐,而語料庫本身的質量更優(yōu)秀、產(chǎn)出的結果也就會更好。有得天獨厚的資源作為基礎,知乎如果對大語言模型視而不見,未免就過于暴殄天物了。
反過來說,大語言模型其實也需要知乎的優(yōu)質答主來幫助其實現(xiàn)迭代,讓大語言模型的文本理解和上下文關聯(lián)能力進一步升級。
眾所周知,基于人類反饋的強化學習(RLHF)是ChatGPT得以爆發(fā)的秘密武器,雖然目前OpenAI還沒有開源RLHF,外界只知道它是強化學習(RL)的一個擴展,是將人類的反饋納入訓練過程,為機器提供一種自然的、人性化的互動學習過程。
而ChatGPT自己給出的解釋,就是與傳統(tǒng)的RL相比,RLHF的優(yōu)勢在于能更好地與人類的意圖保持一致,允許機器掌握明顯嵌入人類經(jīng)驗中的決策要素,并從各種類型的反饋中進行學習,且根據(jù)需要對反饋進行整理。
所以人類的反饋無疑是ChatGPT智能化的關鍵,那么知乎能不能扮演這樣的一個角色呢?答案顯然是肯定的,因為知乎是基于“認知盈余”建立起來的問答社區(qū)。如果將AI生成的回答放到知乎上,讓不同領域的專業(yè)用戶來驗證,就可以在反復調校中優(yōu)化AI的性能。反過來講,高質量的原創(chuàng)內容也更容易被AI發(fā)現(xiàn),這有助于改變知乎在如今泥沙俱下的環(huán)境里、優(yōu)質內容越來越難以被用戶發(fā)現(xiàn)的困局。
至于為什么要將知海圖AI的第一個應用場景聚焦在“熱榜摘要”,知乎CEO周源在接受媒體采訪時就表示,這是從早期產(chǎn)品“回答總結”中汲取的靈感。他表示,“那個功能(回答總結)是開放給所有用戶,大家進行wiki一樣的編輯,后來發(fā)現(xiàn)這個事情太困難了,回答數(shù)量多了以后成本非常高,而且效果并不好,現(xiàn)在則可以通過技術的方式,幫人來完成這樣的事情。”
如果直接用大語言模型來進行創(chuàng)作,并回答知乎上的問題,結果幾乎一定是災難性的的。相信許多朋友在使用ChatGPT、文心一言,以及New Bing時就會發(fā)現(xiàn),生成式人工智能有一個非常突出問題,那就是一本正經(jīng)的胡說八道。但之所以用戶知道ChatGPT在胡說,是因為在提問前你就已經(jīng)對答案有了一個大概的認識,是有能力判斷他所給出的結果正確與否。可如果用戶對問題的答案沒有概念呢?
知海圖AI在熱榜摘要上小試牛刀,可以說是知乎因地制宜來實現(xiàn)以點破面的方式,因為這個功能是面向內容消費者、而非生產(chǎn)者的。通過近似于“長話短說”的熱榜摘要功能,用戶不需要仔細瀏覽具體的回答,就可以大致了解大家圍繞熱榜話題進行了哪些評論,這對于以實時消息為主的知乎熱榜而言,最大的好處就是將信息濃縮、以幫助用戶提高效率。
在這個內容消費不斷碎片化的時代,短視頻的脫穎而出就已經(jīng)證明了用戶對于仔細“咀嚼”內容,以提煉信息這件事,是越來越?jīng)]有耐心了。高質量的內容雖然是知乎的立身之本,但隨著邀請制被廢除,門檻降低后的大眾化策略除了帶來海量的用戶外,也讓知乎的大環(huán)境泥沙俱下,有價值的內容被發(fā)掘的難度越來越大。而有了熱榜摘要,用AI來幫助用戶發(fā)掘優(yōu)質內容,自然也就能盤活資源。
不過對于創(chuàng)作者來說,熱榜摘要可能并非一個福音。將熱榜問題的回答去粗取精、再整理到用戶面前,盡管滿足了用戶無障礙獲取信息的痛點,但代價是用戶既然已經(jīng)看完了精華,還會不會去繼續(xù)查看具體的回答呢。所以結果會是做出了優(yōu)質回答的答主可能不會被用戶發(fā)現(xiàn)并關注,這也就代表著屬于優(yōu)質答主的流量無形中會變少。
順著這一思路再發(fā)散一下會發(fā)現(xiàn),既然用戶尋找答案的工作被AI代替,也就意味著熱榜摘要有減少用戶使用時長的風險。在其他APP都在想方設法讓用戶留下的情況下,知乎這無疑是反其道而行之。并且對于一個依賴廣告和商業(yè)化內容解決方案的平臺而言,用戶停留時間短幾乎就等于流量變差,所以這似乎并非一個好的結果。