【深度】誰在互聯(lián)網(wǎng)上生產(chǎn)垃圾?
垃圾信息的生產(chǎn)已有成熟的流水線,而與其的對(duì)抗與縱容,也成為互聯(lián)網(wǎng)世界中的常態(tài)。
記者 |佘曉晨
編輯 |文姝琪
超過6成的中國人在網(wǎng)絡(luò)平臺(tái)消費(fèi)內(nèi)容,同時(shí),其中一部分人也扮演著生產(chǎn)者的角色。
隨著Twitter、微博的出現(xiàn),UGC(User Generated Content,用戶生產(chǎn)內(nèi)容)開始成為網(wǎng)民在互聯(lián)網(wǎng)上瀏覽的重要信息。根據(jù)中國網(wǎng)絡(luò)視聽節(jié)目服務(wù)協(xié)會(huì)發(fā)布的報(bào)告,截至2020年12月,我國網(wǎng)絡(luò)視聽用戶規(guī)模達(dá)9.44億,其中短視頻用戶已達(dá)8.73億。
UGC平臺(tái)隨著移動(dòng)互聯(lián)網(wǎng)的擴(kuò)張愈加普及和通用,而它的副作用也隨之而來——首先是注意力被占用,緊接著是迅速消逝的時(shí)間和被放大的情緒。而在海量?jī)?nèi)容當(dāng)中,能找出真正稱得上是“有用信息”的東西,無異于在沙里淘金。
很多用戶都有過這樣的經(jīng)歷,抖音里經(jīng)常能刷到不同的博主念著一模一樣的文案,煞有介事地給觀眾說教或者科普,實(shí)際上他們也不懂自己說的是什么。這些都是做號(hào)團(tuán)隊(duì)在背后操縱批量生產(chǎn)。
垃圾信息的生產(chǎn)已有成熟的流水線,而與其的對(duì)抗與縱容,也成為互聯(lián)網(wǎng)世界中的常態(tài)。
流水線
有生產(chǎn)者毫不諱言自己產(chǎn)出的內(nèi)容就是“垃圾”。
2018年后,抖音快手迅速崛起,信息流廣告成為極為熱門的投放方式。于夢(mèng)在一家教育公司上班,她的工作是做出適合“混在”抖音里的廣告。這些廣告會(huì)被投放到“目標(biāo)用戶”的終端里,吸引他們點(diǎn)開,再引流到自家的教育課程APP上。
這份工作肯定談不上是創(chuàng)作。
“首先是分析數(shù)據(jù),從廣告上線到用戶觸達(dá),都有一系列的硬性指標(biāo)去衡量?!崩ψ∮趬?mèng)的KPI包括且不限于點(diǎn)擊率、轉(zhuǎn)化率、3秒播放、5秒播放等等數(shù)據(jù)。教育行業(yè)的特殊性讓她覺得工作多少有點(diǎn)意義,但她還是覺得,這些視頻“99%都是垃圾”。
做信息流廣告,沒有量,一切都是空談。在于夢(mèng)的團(tuán)隊(duì)里,一個(gè)人一個(gè)月可以做出150條左右的視頻。這意味著每天每個(gè)人需要產(chǎn)出7條內(nèi)容。每條視頻有自己的去處——它們對(duì)應(yīng)著不同的抖音ID,一個(gè)ID就是一個(gè)廣告“點(diǎn)位”。
上傳好一條視頻后,于夢(mèng)會(huì)在后臺(tái)設(shè)置出對(duì)應(yīng)的“點(diǎn)位”。地理位置、年齡、手機(jī)類型甚至職業(yè),都能成為“點(diǎn)位”的區(qū)分點(diǎn)。
公司業(yè)務(wù)增長(zhǎng)確實(shí)也從中獲益,但那些點(diǎn)擊量極高的視頻在哪一個(gè)環(huán)節(jié)起了作用,并沒有一個(gè)確定的原因。
于夢(mèng)說,爆款短視頻廣告的成功有運(yùn)氣成分,而制作投放只是基礎(chǔ)動(dòng)作。在視頻內(nèi)容同質(zhì)化競(jìng)爭(zhēng)越來越強(qiáng)的情況下,后續(xù)的效果還需要市場(chǎng)檢驗(yàn)??偠灾渴怯杏玫?。于夢(mèng)和她的同事只能周而復(fù)始地生產(chǎn)內(nèi)容。
另一部分流水線的搭建則源于甲方對(duì)“流量”的需求。評(píng)論、點(diǎn)贊、轉(zhuǎn)發(fā)——所有的可量化指標(biāo)都會(huì)變成“數(shù)據(jù)”,沒人在意數(shù)據(jù)之下,100字的內(nèi)容到底從何而來。
“沖熱搜”是李暉工作中最重要的部分??蛻粲行枰臅r(shí)候,李暉負(fù)責(zé)找水軍、找大V發(fā)帖。從素人號(hào)到KOL,所有的內(nèi)容發(fā)布都是明碼標(biāo)價(jià)的。
負(fù)面輿情處理是最典型的例子。一兩個(gè)小時(shí)之內(nèi),李暉和他的團(tuán)隊(duì)就能完成幾十個(gè)內(nèi)容模板,然后通過“水軍供應(yīng)商”發(fā)布出去。
做出閱讀量和熱度是最基本的操作,屬于供應(yīng)商們的“數(shù)據(jù)維護(hù)”業(yè)務(wù)。而在所有“水軍”中,素人號(hào)是最多的,“隨手點(diǎn)開一個(gè)熱門微博的評(píng)論就有”;預(yù)算足夠的話,就可以買到更高級(jí)的僵尸粉,他們的賬號(hào)權(quán)重更高,評(píng)論會(huì)排在前面。
李暉比任何人都清楚哪些東西是假的。他對(duì)水軍的文案“套路”爛熟于心,點(diǎn)開微博熱搜,李暉基本上可以判斷出哪些詞條是買上去的。
對(duì)抗“垃圾”
更多的“垃圾”躲在暗處。
它們像是內(nèi)容廣場(chǎng)里的蛀蟲:一旦野蠻生長(zhǎng),整個(gè)廣場(chǎng)都會(huì)被腐蝕。在QQ群搜索“知乎批量評(píng)論”、“小紅書筆記代發(fā)”,組織者用2元的低廉價(jià)格獲取一條垃圾信息,一條條黑灰產(chǎn)業(yè)鏈就此延伸。
和垃圾對(duì)抗是魏寧的日常工作。作為一家國內(nèi)安全服務(wù)公司的產(chǎn)品負(fù)責(zé)人,他和團(tuán)隊(duì)為很多知名互聯(lián)網(wǎng)公司提供內(nèi)容安全服務(wù)。涉黃、涉政和暴恐內(nèi)容,都屬于他們監(jiān)測(cè)的范圍。
算法和模型是其中的關(guān)鍵。首先加入戰(zhàn)斗的是負(fù)責(zé)人工打標(biāo)的員工,他們熟知哪些網(wǎng)站有“垃圾內(nèi)容”的素材,這是他們搜集樣本的來源。一個(gè)樣本里通常只有1-2處可以標(biāo)注出來的垃圾內(nèi)容特征,被標(biāo)注的樣本進(jìn)入模型側(cè),再進(jìn)行后續(xù)的機(jī)器學(xué)習(xí)和訓(xùn)練。
最近一兩年,黑灰產(chǎn)中的垃圾內(nèi)容是內(nèi)容安全產(chǎn)品重點(diǎn)監(jiān)測(cè)的領(lǐng)域,例如殺豬盤。發(fā)布這些內(nèi)容的人往往來自于同一個(gè)團(tuán)伙。魏寧稱,在檢測(cè)出發(fā)布者的設(shè)備后,他們會(huì)將此設(shè)備上登錄的賬號(hào)都定義為違規(guī),然后直接封禁該設(shè)備。這樣一來,垃圾內(nèi)容的發(fā)布者就需要換個(gè)賬號(hào)甚至換個(gè)手機(jī)來去進(jìn)行下一次發(fā)布,成本就會(huì)大幅提高。
“這些發(fā)布者往往有一些共性的行為特征,例如注冊(cè)登陸的行為、使用的頭像以及對(duì)自己的描述和聊天內(nèi)容?!笨偨Y(jié)下來,魏寧認(rèn)為,最好的辦法是將業(yè)務(wù)安全和內(nèi)容安全相結(jié)合,提高垃圾內(nèi)容的發(fā)布成本。
大公司逐漸完善自己研發(fā)的內(nèi)容審核平臺(tái),而不少中等規(guī)模的內(nèi)容平臺(tái)則會(huì)選擇和魏寧的團(tuán)隊(duì)合作。審核的技術(shù)思路大多類似,但大廠配備的審核人員更多,用“人工+AI”完成整個(gè)檢測(cè)過程。
不過與此同時(shí),垃圾生產(chǎn)者們也會(huì)學(xué)著“進(jìn)步”,想盡辦法繞過平臺(tái)監(jiān)管。
從平臺(tái)角度看,生產(chǎn)與清理也是一個(gè)持續(xù)對(duì)抗的過程。
一位從2014年開始從事內(nèi)容安全服務(wù)的產(chǎn)品總監(jiān)告訴界面新聞,他們研發(fā)的產(chǎn)品人工復(fù)審率在3%以內(nèi)。如果一個(gè)平臺(tái)一天有1萬個(gè)內(nèi)容數(shù)據(jù),內(nèi)容審核員只需要重點(diǎn)審核處理其中的300多個(gè),相比人工的效率提升將近30倍。
但算法亦有其存在的弊病。正因?yàn)槠脚_(tái)過于依賴算法,內(nèi)容生產(chǎn)者往往會(huì)思考如何“踩中”算法的推薦點(diǎn),優(yōu)先級(jí)甚至高于取悅用戶。在今日頭條工作過的一位運(yùn)營看來,這也會(huì)導(dǎo)致內(nèi)容的畸形。比如一些文章標(biāo)題堆砌著容易得到流量推薦的關(guān)鍵詞,但連文本通順都難以做到。
這也是為什么互聯(lián)網(wǎng)公司需要大量“運(yùn)營”崗位——人必須和技術(shù)一起對(duì)抗垃圾,“和算法做斗爭(zhēng)”也存在必要性。
縱容
“垃圾”一定是不必要的嗎?對(duì)于大公司來說,未必能給出肯定的答復(fù)。
在某個(gè)頭部手機(jī)廠商實(shí)習(xí)的經(jīng)歷,顛覆了姜玲玲對(duì)“內(nèi)容運(yùn)營”這個(gè)崗位的認(rèn)知。她的工作職責(zé)是給公司的新產(chǎn)品拉新促活。再細(xì)化一下工作任務(wù),則是每天逛豆瓣和貼吧,找到合適的內(nèi)容“搬運(yùn)”到新的APP。
新產(chǎn)品面向下沉用戶,足夠“下沉”的內(nèi)容才受歡迎,越是“震碎三觀”的故事越有閱讀量,比如家長(zhǎng)里短、婚戀相親、美女八卦。找到這些內(nèi)容之后,姜玲玲需要快速改寫,在公司開發(fā)的APP里批量發(fā)布,“不停灌水”。
在某個(gè)文娛互聯(lián)網(wǎng)公司工作過的劉燕有相似的經(jīng)歷。在公司開發(fā)的音樂類APP上線之初,劉燕的工作是在各大音樂播放軟件中翻找評(píng)論,通過搬運(yùn)和改寫,為每一首歌“匹配”5-6條人工評(píng)論。每天下班之前,100多首歌曲和評(píng)論被匯總在excel表格里,顯示她的工作成果。
即使過了早期發(fā)展的階段,平臺(tái)對(duì)于垃圾內(nèi)容的態(tài)度也不是非黑即白。在這里,定義“價(jià)值”需要另一套衡量標(biāo)準(zhǔn):在不違規(guī)的情況下,內(nèi)容本身能夠吸引用戶,就是最大的價(jià)值。
對(duì)于那些重復(fù)的、沒有什么營養(yǎng)的垃圾信息,上述今日頭條的運(yùn)營能感受到平臺(tái)的某種包容。作為一個(gè)信息聚合類的平臺(tái),今日頭條缺少原生熱點(diǎn),因此需要大量的內(nèi)容支撐整個(gè)平臺(tái)的運(yùn)作。信息量足夠大,用戶才能搜索到想要的東西,算法的精確性才能得以驗(yàn)證和提升。一位業(yè)務(wù)領(lǐng)導(dǎo)曾在開會(huì)的時(shí)候?qū)λ麄冋f,運(yùn)營的工作就像是“在大海里撈魚”。
事實(shí)也證明了這種“包容”的作用。公開信息顯示,今日頭條上線一年后,用戶數(shù)突破5000萬;上線4年時(shí)間,累積6億的激活用戶;2021年Q1,Trustmobile數(shù)據(jù)顯示,今日頭條的月活超過2.8億。
一些猶豫是否要?jiǎng)?chuàng)造大海的產(chǎn)品也消失了。幾年前,一個(gè)新聞資訊產(chǎn)品在今日頭條的迅猛攻勢(shì)下出現(xiàn)危機(jī)感。一位參與該產(chǎn)品運(yùn)作的人士告訴界面新聞,她明顯感覺到,對(duì)于是否“包容”垃圾信息,團(tuán)隊(duì)內(nèi)部始終沒有達(dá)成一致。在APP上線很久之后,內(nèi)容編輯還在各種會(huì)議上探討,“是否要給下沉市場(chǎng)的人群傳送垃圾內(nèi)容?”如今,該APP已經(jīng)關(guān)停。
在用戶增長(zhǎng)和高質(zhì)量?jī)?nèi)容面前,平臺(tái)方始終保持著一種微妙的博弈態(tài)度。但隨著競(jìng)爭(zhēng)和監(jiān)管的加強(qiáng),平臺(tái)也意識(shí)到,一個(gè)想要長(zhǎng)遠(yuǎn)發(fā)展下去的產(chǎn)品,必須提供更干凈的海洋。
據(jù)Tech星球報(bào)道,今年今日頭條成立了兩個(gè)新業(yè)務(wù)團(tuán)隊(duì),其中一個(gè)團(tuán)隊(duì)將去做定位高端的資訊平臺(tái)和智能閱讀工具“識(shí)區(qū)”。早期以“土味視頻”為增長(zhǎng)引擎的快手,今年也頻繁發(fā)力知識(shí)類視頻和直播內(nèi)容。一位創(chuàng)業(yè)者決定在今年投身知識(shí)內(nèi)容的孵化,原因是“平臺(tái)不會(huì)永遠(yuǎn)給用戶喂垃圾。”
但商業(yè)公司的天性是追逐利益,人的天性則是尋求不費(fèi)力的趣味和刺激。在技術(shù)之外,和垃圾信息的對(duì)抗,更像是人性與人性之間的永恒戰(zhàn)爭(zhēng)。
?。☉?yīng)采訪對(duì)象要求,文中所涉人名均為化名)