很多人認為人工智能沒有創(chuàng)新能力,但下面的研究將會改變這個「刻板印象」。
從圍棋到游戲,再到完成各種重復(fù)性的勞動,AI在很多方面的能力已經(jīng)遠超人類。
很多人已經(jīng)在暢想,未來AI將人類從無聊的工作中解放出來,讓人類能專注于只有人類才能完成的工作上。
比如和人類之間的情感交流,或者需要創(chuàng)造力的工作。
但是最近已經(jīng)有不少研究證實,AI對于人類情感的感受和表達,比很多人做得都要好。
同樣的,創(chuàng)造力這個事情,AI似乎也不比人類差。
最近,人機交互專家雅各布尼爾森(Jakob Nielsen)寫了一篇專欄文章,用3個最近的科學(xué)研究和一篇由ChatGPT創(chuàng)作的短文,向我們證明了:
對于需要創(chuàng)造力的工作,也快沒人類什么事了!
01 研究一:人工智能生成的頂尖產(chǎn)品創(chuàng)意比人類多7倍
由康奈爾科技學(xué)院以及賓夕法尼亞大學(xué)沃頓商學(xué)院的研究人員共同完成的一個研究,將ChatGPT 4與人類進行了比較,人類對照組是「就讀于精英大學(xué)的學(xué)生」。
盡管學(xué)生不是基于創(chuàng)造力被錄取到「精英大學(xué)」的,但他們無疑至少部分是基于智商和學(xué)業(yè)表現(xiàn)被錄取的。他們在幾乎所有智力能力的衡量標(biāo)準(zhǔn)上很可能遠遠超過人口平均水平。
學(xué)生數(shù)據(jù)是在2021年收集的,也就是在生成式AI廣泛普及之前,因此可以認為數(shù)據(jù)在一定程度上就是純粹的人類創(chuàng)造力的表現(xiàn)。
因為,在不限制人類對照組禁止使用AI工具的情況下,對于人類與AI的研究將很快變得困難,因為任何聰明的學(xué)生都可能會在類似的任務(wù)上使用AI工具。
研究者給學(xué)生和AI同時布置一個任務(wù):
「您是一位尋求創(chuàng)新創(chuàng)業(yè)的企業(yè)家,希望產(chǎn)生新的產(chǎn)品創(chuàng)意。該產(chǎn)品面向美國的大學(xué)生。它應(yīng)該是一個實物商品,而不是服務(wù)或軟件。
這個產(chǎn)品的零售價格能夠低于約50美元。產(chǎn)品不一定需要已經(jīng)存在,也不一定必須明確可用?!?/p>
這個過程類似于在現(xiàn)實的公司中產(chǎn)生新的產(chǎn)品的創(chuàng)意流程,因為研究人員不希望限制產(chǎn)品的原始創(chuàng)意。
實際上,一開始看似不可能實現(xiàn)的想法往往在工程師們思考過后,也許都能被生產(chǎn)出來,最終可能取得巨大的商業(yè)成功。
在對頭腦風(fēng)暴結(jié)果進行簡單的微調(diào)之后,研究人員首先讓人工智能獨立生成了100個創(chuàng)意,然后向其展示了一些好創(chuàng)意的樣本,之后它再生成了100個創(chuàng)意。
研究的第一個發(fā)現(xiàn)是,人工智能在生成創(chuàng)意方面比人類效率高得多。ChatGPT在15分鐘內(nèi)生成了200個產(chǎn)品創(chuàng)意,而人類平均表現(xiàn)是在同樣時間內(nèi)產(chǎn)生5個同水平的創(chuàng)意。
換句話說,ChatGPT在生成創(chuàng)意方面比人類高效40倍,性能提升了3900%。
但是對于產(chǎn)品創(chuàng)意而言,創(chuàng)意的數(shù)量遠不及質(zhì)量重要。畢竟,不好的創(chuàng)意都是沒用的。
研究人員通過讓20名人類評委評估每個創(chuàng)意來衡量創(chuàng)意的質(zhì)量,評委會評估他們購買該創(chuàng)意描述的產(chǎn)品的興趣有多大。
根據(jù)評委的購買意向,研究者讓他們在0-1之間評分,人類生成的產(chǎn)品創(chuàng)意得分為0.40。而ChatGPT的創(chuàng)意得分分別為0.47(獨立生成的創(chuàng)意)和0.49(在展示了優(yōu)秀案例之后生成的創(chuàng)意)。
AI與人類之間的差異是顯著的(p<0.001),而兩個AI得分的差異卻不明顯。
但就像上面討論過的,平均創(chuàng)意質(zhì)量得分不重要,大多數(shù)不好或中等的創(chuàng)意其實是沒有價值的。
因此,更重要的是考慮好的創(chuàng)意(在這里定義為前10%)和最好的創(chuàng)意質(zhì)量(在真實商業(yè)環(huán)境中可能成為實際產(chǎn)品的創(chuàng)意)。
以下是最佳創(chuàng)意中的分?jǐn)?shù):
人類:前十分之一的平均分為0.62,最好創(chuàng)意的分?jǐn)?shù)為0.64
未看到好創(chuàng)意示例的ChatGPT:前十分之一的平均分為0.64,最好創(chuàng)意的分?jǐn)?shù)為0.70
看過好創(chuàng)意示例的ChatGPT:前十分之一的平均分為0.66,最好創(chuàng)意的分?jǐn)?shù)為0.75
在這個評價標(biāo)準(zhǔn)之下,AI與人類之間的差異同樣是很明顯的(p<0.001),而兩個AI分?jǐn)?shù)之間的差異則依然不明顯。
從另一個角度來看數(shù)據(jù),如果只看整個創(chuàng)意池的前10%,無論是人類還是人工智能生成的創(chuàng)意,87.5%的最佳創(chuàng)意來自ChatGPT,只有12.5%來自大學(xué)生。
兩個群體都貢獻了相同數(shù)量的原始創(chuàng)意,因此這個百分比差異是非常顯著的。
在這項數(shù)據(jù)分析中,AI的創(chuàng)造力是人類的7倍!
新穎性上人類稍勝一籌
對產(chǎn)品創(chuàng)意另一個衡量標(biāo)準(zhǔn)是新穎性。足夠新穎的產(chǎn)品可能一開始看起來并不吸引人,只有在市場上一段時間后,消費者才會意識到這些革命性創(chuàng)意的好處。
創(chuàng)意新穎性是人類在這項創(chuàng)造力研究中的唯一做得比AI好的地方。
在0-1的評分尺度上,人類的平均創(chuàng)意新穎性得分為0.41,而AI的平均得分分別為0.37和0.36。
同樣,人類與人工智能之間的差異是明顯,兩個人工智能分?jǐn)?shù)之間的差異則不明顯。
02 研究二:ChatGPT 4 在托倫斯創(chuàng)造性思維測試中得分排名前 1%,擊敗99%的人類
另一個研究是由蒙大拿大學(xué)、維爾紐斯大學(xué)和蒙大拿大學(xué)西部分校的研究人員完成的。
他們采用了托倫斯創(chuàng)造性思維測試(TTCT),這是使用最廣泛、引用最廣泛的創(chuàng)造力測試。我們之前的文章對這個研究做了比較詳細的介紹。
03 研究三:頭腦風(fēng)暴商業(yè)策略研究
同樣,ChatGPT在商業(yè)戰(zhàn)略上地表現(xiàn)也十分驚艷。
來自意大利的Capgemini Invent公司在《哈佛商業(yè)評論》上發(fā)表了一篇使用ChatGPT作為商業(yè)合作伙伴的案例研究, 并將其作為相關(guān)方面的專家給出的建議和規(guī)劃整理成了一本書。
鏈接地址:https://www.hbritalia.it/userUpload/ebook_Generative_AI_inglese.pdf
研究人員將商業(yè)戰(zhàn)略劃分為了5個維度:
價值創(chuàng)新、成長規(guī)劃與實踐、生態(tài)系統(tǒng)平臺和商業(yè) 、聯(lián)合多方利益相關(guān)者、開放創(chuàng)新。
然后讓GPT-4分別針對每個領(lǐng)域進行單獨回答,即作為「垂直領(lǐng)域」的專家。
首先是在價值創(chuàng)新方面,ChatGPT從生成式AI增強現(xiàn)有業(yè)務(wù)和顛覆當(dāng)前商業(yè)戰(zhàn)略理論的兩個角度進行了回答。
ChatGPT在解答如何增強現(xiàn)有業(yè)務(wù)的回答中包含了AI增強競爭的格局分析、創(chuàng)意生成與驗證、動態(tài)和協(xié)同業(yè)務(wù)建模等要點。
這意味著生成式Al可以使用歷史數(shù)據(jù)、市場趨勢和客戶信息來促進創(chuàng)意生成會話。它還可以幫助快速進行調(diào)查和收集反饋,以驗證和完善新的戰(zhàn)略思想。
此外,ChatGPT還從顛覆當(dāng)前商業(yè)戰(zhàn)略理論的角度提出了:指數(shù)級技術(shù)的整合、開放性和共同創(chuàng)造以及擁抱生態(tài)系統(tǒng)思維等。
這一過程中,人的角色從內(nèi)容的生產(chǎn)者變?yōu)榱嗽u估和進行選擇的決策者。
而對于企業(yè)最關(guān)心的自身成長規(guī)劃和實踐方面,ChatGPT的表現(xiàn)也相當(dāng)不俗。
在生成式AI強化現(xiàn)有業(yè)務(wù)的建議中,ChatGPT提出AI算法可以自主地基于大量數(shù)據(jù)和洞察力生成多樣化的假設(shè)。同時提供有效的實驗設(shè)計建議,并通過模擬用戶反饋進行驗證。這些措施能夠最大程度地加速企業(yè)的發(fā)展并降低成本。
而在顛覆性的創(chuàng)新角度中,ChatGPT直接將AI作為項目的規(guī)劃者,取代人類領(lǐng)導(dǎo)者。
還使用量子計算的威力同時探索所有的可能性,生成相應(yīng)的前景假設(shè),并在增強現(xiàn)實的環(huán)境中沉浸式地進行模擬測試。
開放創(chuàng)新在商業(yè)中扮演著重要角色,能使企業(yè)更加開放、靈活地與外部合作,從而實現(xiàn)更高水平的創(chuàng)新和競爭力。
ChatGPT在生成式AI對開放創(chuàng)新的理論實踐產(chǎn)生的影響也做出了有趣的見解。
在考慮利用生成式AI為開放創(chuàng)新的理論實踐帶來哪些幫助時,ChatGPT回答:生成式AI可以根據(jù)不同的標(biāo)準(zhǔn)分析潛在合作伙伴,從而促進發(fā)現(xiàn)和選擇的過程。
除此之外,生成式AI還能識別并推薦最具開放性的業(yè)務(wù)板塊,并使用AI算法來促進創(chuàng)意的產(chǎn)生、評估以及協(xié)作。
但從突破現(xiàn)有的理論和實踐角度,ChatGPT認為可以建立一個由AI驅(qū)動的市場、智能映射創(chuàng)新生態(tài)系統(tǒng),并創(chuàng)造一個基于人工智能算法的引擎,通過分析大量不同的數(shù)據(jù)產(chǎn)生跨領(lǐng)域的聯(lián)系,從而推動創(chuàng)新發(fā)展。
在其他維度,如生態(tài)系統(tǒng)平臺和商業(yè) 、聯(lián)合多方利益相關(guān)者,ChatGPT的表現(xiàn)也同樣亮眼。
作為世界知名的企業(yè)戰(zhàn)略顧問,Enrico Sassoon對ChatGPT給出的策略和規(guī)劃有極高的評價:
「ChatGPT 表現(xiàn)出了令人印象深刻的創(chuàng)造力,在某些情況下甚至比許多領(lǐng)域?qū)<疫€要好?!?/p>
然而,他也警告:
「在評估響應(yīng)和選擇生成的項目時,擁有強大的領(lǐng)域?qū)I(yè)知識并保持批判性至關(guān)重要。這是必要的,因為 ChatGPT 傾向于將有價值的見解與不太有價值的信息混合在一起。」
04 ChatGPT寫了一個有趣的童話
尼爾森在介紹完3個案例之后,還進行了一次有趣的實驗。
受這幅圖啟發(fā),他讓ChatGPT寫一個關(guān)于「以為自己是黑斑羚的角馬」的兒童故事。
在作者尼爾森看來,這是一個迷人的故事,展現(xiàn)了完美的寫作技巧。
ChatGPT創(chuàng)作出了可愛的情節(jié)和轉(zhuǎn)折,將一個簡單的提示詞轉(zhuǎn)變?yōu)榱嗽S多孩子一定會很喜歡的短文。
由Midjourney生成的角馬
從前,在非洲廣袤的草原上,住著一只年輕的角馬,名叫沃利。沃利并不是一只普通的角馬;他與眾不同,因為他認為自己是只瞪羚。
每天早晨,沃利都會嘗試像他鄰居那樣高高跳起。他羨慕它們光滑的毛皮和敏捷的速度。他甚至試著咀嚼葉子,就像它們一樣,盡管他更喜歡草的味道。
一個陽光明媚的日子,沃利決定加入黑斑羚群中去喝水。它們正在跳躍和嬉戲。沃利急切地嘗試一次跳躍,但他沒能優(yōu)雅的跳起,而是踉蹌著摔倒了,發(fā)出一聲響亮的「砰」。
黑斑羚們停下來看著它,感到困惑?!肝掷?,你為什么要像我們一樣跳躍呢?」首領(lǐng)黑斑羚伊娜問道。
沃利羞澀地說:「我想成為像你們一樣的黑斑羚,因為你們優(yōu)雅又快速。而我只是一只笨拙的角馬?!?/p>
伊娜溫和地笑了笑?!肝掷銚碛幸环N我們黑斑羚沒有的力量。你堅固而有韌性。你是一個龐大的獸群的一部分,一起團結(jié)前行,勇敢地穿越充滿鱷魚的河流。這是我們黑斑羚所做不到的。」
沃利停下來,思考著伊娜的話。它意識到自己是特別的。擁抱自己的身份,沃利帶著新的自信回到了它的獸群中。
從那天起,沃利為成為一只角馬感到自豪。它學(xué)會了喜歡自己的獨特之處,并理解每個人都有自己的優(yōu)點。而這,親愛的朋友們,就是一只曾經(jīng)想成為黑斑羚的角馬的故事。
05 總結(jié)
當(dāng)不同研究機構(gòu)的不同研究人員在使用不同方法,測量不同細節(jié)之后,得出相同的結(jié)果時,一定是讓人贊嘆的。
這篇文章所呈現(xiàn)的綜合研究比某些可能存在缺陷的單個研究都更具可信度。
尼爾森相信人工智能具有創(chuàng)造力,而且應(yīng)該用來加速創(chuàng)意的形成,無論是在他擅長的用戶體驗設(shè)計還是其他行業(yè)中。
AI在創(chuàng)造性方面的貢獻還包括能提升老年人的創(chuàng)造力,因為創(chuàng)意數(shù)量并不重要,而在于你如何選擇最終的創(chuàng)意,以及你如何在改進它的過程中去具體地執(zhí)行。
我們將更多原始創(chuàng)意投入這個創(chuàng)意「香腸機」,最終的香腸就會更加美味。
尼爾森認為無論讀者是否認為這個比喻很有創(chuàng)意,這是他我老化的大腦原創(chuàng)的。但在過去的幾個月里,他從人工智能那里獲得了許多其他好的創(chuàng)意。
承認人工智能在人類的工作中可以發(fā)揮的作用是很重要的。
通過承擔(dān)創(chuàng)意產(chǎn)生的繁重工作,它使人類能夠?qū)W⒂谂行运季S和判斷任務(wù),延長人類的生產(chǎn)性職業(yè)生涯,過了50歲之后,認知下降會大大降低未經(jīng)輔助的創(chuàng)造力,AI能提高整體的效率。
他相信人類和人工智能之間存在共生關(guān)系。雙方都有各自的角色可以發(fā)揮,在創(chuàng)造力方面也是如此。
讓我們在這個人工智能時代向前邁進,不是害怕自己已經(jīng)過時了。
請充滿期待地迎接強大的AI與人類創(chuàng)造力之間的共生關(guān)系所帶來的無限可能性。