OpenAI推出網絡爬蟲機器人GPTBot:收集數據改進AI模型
快科技8月8日消息,OpenAI推出了一種名為GPTBot的網絡爬蟲機器人,用于收集信息數據以改進未來的AI模型。
據了解,GPTBot將嚴格遵守任何付費墻的規(guī)則,不會抓取需要付費的信息,并且也不會收集能追蹤到個人身份的數據。
不僅如此,OpenAI也把是否要把自己的網站數據供GPTBot抓取的選擇交到給網站所有者,他們可自行修改其robots.txt文件?;蛘咄ㄟ^屏蔽其IP地址,來阻止GPTBot從其網站上抓取數據。
這當然仍不足夠,修改robots.txt是一種方式,但它可以更便利和更具透明度,也可進一步告知數據將被用于什么用途等等。
此前,OpenAI抓取公開數據來訓練專利AI模型的行為備受爭議。Reddit和Twitter等網站,已經采取措施打擊AI公司免費使用其用戶帖子的行為,而一些作者和其他創(chuàng)作者也因為涉嫌未經授權使用其作品而提起訴訟。
最新推薦
閱讀排行榜
欄目索引
相關內容