據(jù)報道,谷歌的人工智能聊天機器人Bard是由數(shù)千名合同工在壓力下訓練的,他們只有3分鐘的時間來審核Bard生成的回答。這些合同工來自各大公司,他們只接受了最低限度的培訓,時薪只有14美元。他們的工作是評估Bard的回答是否可靠和準確。 盡管像Bard和ChatGPT這樣的聊天機器人依賴于底層的大型語言模型來生成回答,但是人類也參與了回答的審核過程,以確保它們是可靠和準確的。然而,根據(jù)內部文件和六名合同工的說法,審核Bard回答的人類工作量變得越來越大和復雜。 一名合同工稱,“就目前情況而言,人們感到害怕、壓力大、工資低,不知道發(fā)生了什么。這種恐懼文化不利于我們提高質量和團隊合作?!焙贤さ娜蝿罩痪褪歉鶕?jù)回答來評價其“有用性”,并在“一點也沒有用”到“非常有用”的范圍內打分。 谷歌發(fā)言人在一份聲明中稱:“讓人們獲得高質量的信息是我們使命的核心。我們進行了大量的工作來負責任地構建我們的人工智能產(chǎn)品,包括多年來我們不斷完善的嚴格測試、培訓和反饋過程,以強調事實性和減少偏見。人工評估,包括來自谷歌內部和外部的個人,是我們用來改進產(chǎn)品的眾多方法之一?!痹摪l(fā)言人還稱,“評分并不直接影響我們模型的輸出,它們也絕不是我們提高準確性的唯一方式?!?/span>