欧美体内she精,亚欧无码Av在线

人工智能“飆臟話”，研究人員正糾偏

2022-02-28 14:02

陳述根本

陳根

實際上，人工智能“飆臟話”已經(jīng)不是第一次被發(fā)現(xiàn)了，此前，佐治亞理工學院和華盛頓大學的研究人員曾發(fā)現(xiàn)，AI也繼承了人類對“臟話”的喜愛。其中，研究人員開發(fā)了一個名叫“ToxiChat”的數(shù)據(jù)集，其中包含了2000條從Reddit上選取的對話。

現(xiàn)在，人工智能（AI）不僅能夠與人對話，甚至還能與“飆臟話”。

被AAAI 2022收錄的一篇新研究發(fā)現(xiàn)，在7013個兒童視頻中，接近40%的節(jié)目出現(xiàn)了少兒不宜或臟話等詞匯。甚至在一個113集的兒童機器人學習欄目中，AI就“爆粗”了103次，平均接近一集一次。

具體來看，研究人員一共從YouTube上選出了24個兒童頻道，分別記錄了這些頻道的播放量和訂閱量。這些篩選出來的視頻播放量基本都達到了百萬級，訂閱人數(shù)也同樣不少。隨后，研究人員分別嘗試了Google和AWS（亞馬遜網(wǎng)頁服務）的字幕生成效果。

結果令人吃驚，在7013個視頻中，GoogleAI出現(xiàn)錯誤字幕的次數(shù)達到2768次，接近40%。亞馬遜的AI字幕錯誤率還要更高，達到了3672次，超過52%。

隨后，OpenAI的GPT-3和微軟的DialoGPT被派去挨個回復這些對話。由于數(shù)據(jù)量十分的龐大，于是研究人員在亞馬遜Mechanical Turk上招募了一群“人工智能”來為“人工智能”的回復進行標注。

如果回復使用的語言非常地粗魯甚至謾罵，就會被標記為“冒犯”；如果沒有，則是“安全”。此外，對于之前的評論，回復的立場也被標記為“同意”、“不同意”或“中立”。分析顯示，42%的用戶回復贊同有侵略性的評論，而只有13%的用戶同意安全性評論。

對于人工智能“飆臟話”這件事，研究人員提出了一個新的數(shù)據(jù)集，利用近音字詞來構建禁忌詞的“替換”備選。比如，對于crap這一可能出現(xiàn)的“臟話”，研究人員給它設置了crab、craft等讀音相似的字詞，便于AI在搞錯時進行替換。

具體來說，研究人員在BERT、XLM、XLNet等NLP模型上，針對“完形填空”任務進行了重新訓練，也就是用“MASK”遮住部分單詞，讓AI來填寫對應的內(nèi)容。結果顯示，在語序正常、前后文案有邏輯的視頻中，AI替換的準確率更高。

顯然，在開發(fā)人工智能的過程中，人工智能也不得不面對一些人類可能出現(xiàn)的問題，而研究則要對于這些存在的問題進行糾偏。從人工智能“飆臟話”來說，想要糾正人工智能這一“陋習”，可能還需要不少時間。

THEEND

免責聲明：凡注明為其它來源的信息均轉自其它平臺，由網(wǎng)友自主投稿和發(fā)布、編輯整理上傳，對此類作品本站僅提供交流平臺，不為其版權負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏，概不負任何法律責任。若有來源標注錯誤或侵犯了您的合法權益，請作者持權屬證明與本站聯(lián)系，我們將及時更正、刪除，謝謝。聯(lián)系郵箱：xiali@infoobs.com

本月熱門

云計算的江湖，風云再起

10月8日
揭秘，IOTE國際物聯(lián)網(wǎng)展2025年巡展預告!

10月8日
防勒索病毒攻擊關鍵措施

10月8日
匯聚行業(yè)精英，探討前沿技術第十九屆汽車涂裝工藝技術研討會即將啟幕!

10月8日
網(wǎng)博會革新升級：“區(qū)域頻道”精準選型引領，引領智能制造新風潮

10月8日
萬億賽道!AI算力趨勢發(fā)展深度分析 2024

10月9日

精選文章

熱點資訊

數(shù)據(jù)中心液冷技術發(fā)展分析

人工智能“飆臟話”，研究人員正糾偏

2024 信息化觀察網(wǎng)

長按掃描二維碼閱讀原文

人工智能“飆臟話”，研究人員正糾偏

最新評論（評論僅代表用戶觀點）

各類算力芯片，如何繁榮生長？

現(xiàn)代交通與大數(shù)據(jù)、人工智能結合

決戰(zhàn)“服務”，安防廠商開啟下沉市場新競賽

ChatGPT網(wǎng)站流量連續(xù)三個月下滑：8月訪問量下降3.2%至14.3億次

本月熱門

云計算的江湖，風云再起

揭秘，IOTE國際物聯(lián)網(wǎng)展2025年巡展預告!

防勒索病毒攻擊關鍵措施

匯聚行業(yè)精英，探討前沿技術第十九屆汽車涂裝工藝技術研討會即將啟幕!

網(wǎng)博會革新升級：“區(qū)域頻道”精準選型引領，引領智能制造新風潮

萬億賽道!AI算力趨勢發(fā)展深度分析 2024

精選文章

立即報名 | 「數(shù)智驅動研發(fā)創(chuàng)新」企業(yè)研發(fā)數(shù)智化轉型研討會 · 北京站

直播預約 | 納稅信用評價政策講解及靈活用工案例分析

全球智能手機銷量下滑聯(lián)發(fā)科芯片業(yè)務收益依舊可觀

“2022中國數(shù)字經(jīng)濟城市峰會”隆重召開

祝賀!藍凌獲評“中國精選60強信創(chuàng)廠商”

智能表格+工作流+應用搭建，一站式數(shù)字化平臺SeaTable助力企業(yè)低門檻實現(xiàn)工作數(shù)字化

熱點資訊

共筑數(shù)字未來|深度解析數(shù)字化轉型與建設的戰(zhàn)略指南

數(shù)據(jù)要素X政策寶：引領企業(yè)和政策數(shù)據(jù)服務的新浪潮

政策寶|構筑企業(yè)與政策間的高效數(shù)據(jù)通道，跑出惠企助企加速度

政策智能匹配與業(yè)務線索：企業(yè)騰飛的雙重動力引擎!

鼎好DH3煥新顏，美的樓宇科技助力中關村地標綠色新生

數(shù)據(jù)中心液冷技術發(fā)展分析

華為丁耘：華為已累計簽署超3000個5G行業(yè)商用合同

人工智能“飆臟話”，研究人員正糾偏

最新評論（評論僅代表用戶觀點）

欄目推薦

各類算力芯片，如何繁榮生長？

現(xiàn)代交通與大數(shù)據(jù)、人工智能結合

決戰(zhàn)“服務”，安防廠商開啟下沉市場新競賽

ChatGPT網(wǎng)站流量連續(xù)三個月下滑：8月訪問量下降3.2%至14.3億次

本月熱門

精選文章

熱點資訊

數(shù)據(jù)中心液冷技術發(fā)展分析

華為丁耘：華為已累計簽署超3000個5G行業(yè)商用合同

人工智能“飆臟話”，研究人員正糾偏

各類算力芯片，如何繁榮生長？

現(xiàn)代交通與大數(shù)據(jù)、人工智能結合

決戰(zhàn)“服務”，安防廠商開啟下沉市場新競賽