国产aⅴ无码专区亚洲av,亚洲一区免费观看,亚洲国产欧美日本视频

Facebook利用10億張社交軟件圖片，訓(xùn)練AI新算法

2021-03-09 09:52

科技行者

我愛(ài)至尊寶

Facebook研究人員日前發(fā)布了一個(gè)新的人工智能模型SEER，SEER模型可以利用互聯(lián)網(wǎng)上任何一組隨機(jī)的、未被標(biāo)記的圖像進(jìn)行學(xué)習(xí)。Facebook這一“突破”雖然還處于早期階段，但團(tuán)隊(duì)預(yù)計(jì)該“突破”將導(dǎo)致計(jì)算機(jī)視覺(jué)領(lǐng)域的一場(chǎng)"革命"。

SEER是SElf-SupERvised（自我監(jiān)督[學(xué)習(xí)]）的英文縮寫，SEER的訓(xùn)練用了10億張公開(kāi)的Instagram圖片，這些圖片是未經(jīng)人工策劃過(guò)的。即圖片沒(méi)有做過(guò)通常用于算法訓(xùn)練的標(biāo)簽和注釋處理，但SEER仍然能夠自主地利用數(shù)據(jù)集一邊學(xué)習(xí)一邊處理數(shù)據(jù)，最終可以在物體檢測(cè)等任務(wù)上達(dá)到最高的準(zhǔn)確度。

SEER用的這種方法被稱為「自我監(jiān)督學(xué)習(xí)」，自我監(jiān)督學(xué)習(xí)在人工智能領(lǐng)域已經(jīng)非常成熟，可以直接從用于訓(xùn)練的信息創(chuàng)建學(xué)習(xí)系統(tǒng)，不必依靠經(jīng)過(guò)仔細(xì)標(biāo)記的數(shù)據(jù)集訓(xùn)練如何執(zhí)行任務(wù)，例如識(shí)別照片里的對(duì)象，或翻譯一段文字等任務(wù)。

自我監(jiān)督學(xué)習(xí)最近在科學(xué)界受到大量關(guān)注，因?yàn)檫@個(gè)方法，意味著對(duì)人類標(biāo)注數(shù)據(jù)的需要少很多，標(biāo)注數(shù)據(jù)是一項(xiàng)費(fèi)力費(fèi)時(shí)的任務(wù)，是大多數(shù)研究人員都不愿做的事情。同時(shí)，由于自監(jiān)督模型不需要經(jīng)人工策劃的數(shù)據(jù)集，因此可以利用更大、更多樣化的數(shù)據(jù)集。

在某些領(lǐng)域（尤其是自然語(yǔ)言處理領(lǐng)域），自我監(jiān)督學(xué)習(xí)方法已經(jīng)取得了突破性的進(jìn)展。許多利用無(wú)標(biāo)記文本訓(xùn)練的算法使得諸如答疑、機(jī)器翻譯、自然語(yǔ)言推理等應(yīng)用取得了各種進(jìn)展。

相比之下，計(jì)算機(jī)視覺(jué)還沒(méi)有完全投入自我監(jiān)督學(xué)習(xí)的革命之中。Facebook AI Research的軟件工程師Priya Gopal稱，SEER標(biāo)志著計(jì)算機(jī)視覺(jué)領(lǐng)域的第一次。她告訴記者，"SEER是第一個(gè)完全自我監(jiān)督的計(jì)算機(jī)視覺(jué)模型，是利用互聯(lián)網(wǎng)的隨機(jī)圖像進(jìn)行訓(xùn)練的，而相比之下，計(jì)算機(jī)視覺(jué)領(lǐng)域現(xiàn)有的自我監(jiān)督方面的工作，都是利用經(jīng)大量編輯過(guò)的ImageNet數(shù)據(jù)集進(jìn)行訓(xùn)練。"

ImageNet實(shí)際上是個(gè)由數(shù)百萬(wàn)張圖片組成的大規(guī)模數(shù)據(jù)庫(kù)，這些圖片都被研究人員標(biāo)注了標(biāo)簽，ImageNet面向廣大計(jì)算機(jī)視覺(jué)界開(kāi)放，目的是推動(dòng)人工智能的發(fā)展。

Facebook的研究人員以該項(xiàng)目的數(shù)據(jù)庫(kù)，作為基準(zhǔn)評(píng)估SEER的性能，他們發(fā)現(xiàn)，自監(jiān)督模型在低照、物體檢測(cè)、分割和圖像分類等任務(wù)上的表現(xiàn)優(yōu)于最先進(jìn)的監(jiān)督型AI系統(tǒng)。

Goyal表示，"SEER僅利用隨機(jī)圖像進(jìn)行訓(xùn)練，性能卻優(yōu)于現(xiàn)有的自我監(jiān)督模型。這個(gè)結(jié)果基本上表明，我們?cè)谟?jì)算機(jī)視覺(jué)中不需要像ImageNet這種經(jīng)高度策劃過(guò)的數(shù)據(jù)集，利用隨機(jī)圖像進(jìn)行自我監(jiān)督學(xué)習(xí)已經(jīng)可以產(chǎn)生非常高質(zhì)量的模型。"

由于自我監(jiān)督學(xué)習(xí)需要的精密程度較高，研究人員在這方面的工作也并非沒(méi)有挑戰(zhàn)。在涉及到文本時(shí)，人工智能模型要做的是賦予單詞特定的意思；但對(duì)于圖像而言，算法必須給每個(gè)像素賦予一個(gè)對(duì)應(yīng)的概念，同時(shí)要考慮同一個(gè)概念在不同圖片中的各種角度、視圖和形狀。

換句話說(shuō)，研究人員處理圖像時(shí)，需要大量的數(shù)據(jù)以及可以復(fù)雜的信息庫(kù)中推導(dǎo)出所有可能的視覺(jué)概念的模型。

Goyal和她的團(tuán)隊(duì)為了達(dá)到這個(gè)目的，在Facebook AI自我監(jiān)督學(xué)習(xí)方面的現(xiàn)有基礎(chǔ)上，開(kāi)發(fā)了名為「SwAV」的新算法，SwAV算法將那些顯示相似概念的圖像分類為不同的組。Facebook科學(xué)家們還設(shè)計(jì)了一個(gè)深度學(xué)習(xí)算法的卷積網(wǎng)絡(luò)，該卷積網(wǎng)絡(luò)可以模擬人腦中神經(jīng)元的連接模式，以及為圖像中的不同對(duì)象賦予不同的重要性。

該系統(tǒng)用了10億Instagram圖的強(qiáng)大數(shù)據(jù)集，至少規(guī)模是夠大了。Facebook的團(tuán)隊(duì)用了V100 Nvidia GPU和32GB內(nèi)存，模型規(guī)模增大后，團(tuán)隊(duì)也只得用模型去套可用的內(nèi)存。但Goyal解釋說(shuō)，下一步的研究將有助于確保計(jì)算能力可以適應(yīng)新系統(tǒng)。

她表示，"我們要在越來(lái)越多的GPU上訓(xùn)練模型時(shí)，GPU之間的通信需要足夠快速，以達(dá)到實(shí)現(xiàn)更快訓(xùn)練的目的。這樣的挑戰(zhàn)可以通過(guò)開(kāi)發(fā)明確的軟件和研究技術(shù)得到解決，開(kāi)發(fā)的軟件和技術(shù)能夠針對(duì)特定的內(nèi)存和運(yùn)行時(shí)間預(yù)算行之有效。"

因此，在SEER付諸實(shí)際使用案例之前還有一些工作要做。但Goyal認(rèn)為，SEER技術(shù)的影響不應(yīng)該被低估。她表示，"SEER技術(shù)使得我們現(xiàn)在可以利用大量豐富的互聯(lián)網(wǎng)隨機(jī)圖像訓(xùn)練大型模型，可以在計(jì)算機(jī)視覺(jué)領(lǐng)域取得各種進(jìn)展。"

Goyal稱，"這一突破，可以實(shí)現(xiàn)計(jì)算機(jī)視覺(jué)領(lǐng)域的自我監(jiān)督學(xué)習(xí)革命，其和我們?cè)谧匀徽Z(yǔ)言處理里看到的涉及文本的自我監(jiān)督學(xué)習(xí)革命有些類似。"

SEER在Facebook內(nèi)部可以用在廣泛的計(jì)算機(jī)視覺(jué)任務(wù)上，包括自動(dòng)生成圖像描述、幫助識(shí)別違反政策的內(nèi)容等等。SEER技術(shù)在Facebook以外的地方也可以在圖像和元數(shù)據(jù)有限的領(lǐng)域發(fā)揮作用，比如醫(yī)療成像。

Facebook的團(tuán)隊(duì)呼吁各方面做更多的工作，以推動(dòng)SEER進(jìn)入下一個(gè)發(fā)展階段。Facebook團(tuán)隊(duì)還開(kāi)發(fā)了基于PyTorch的多用途庫(kù)，可用于自我監(jiān)督學(xué)習(xí)，庫(kù)名為「VISSL」，已開(kāi)源，目的是鼓勵(lì)廣泛的AI社區(qū)使用該技術(shù)進(jìn)行測(cè)試。

THEEND

免責(zé)聲明：凡注明為其它來(lái)源的信息均轉(zhuǎn)自其它平臺(tái)，由網(wǎng)友自主投稿和發(fā)布、編輯整理上傳，對(duì)此類作品本站僅提供交流平臺(tái)，不為其版權(quán)負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏，概不負(fù)任何法律責(zé)任。若有來(lái)源標(biāo)注錯(cuò)誤或侵犯了您的合法權(quán)益，請(qǐng)作者持權(quán)屬證明與本站聯(lián)系，我們將及時(shí)更正、刪除，謝謝。聯(lián)系郵箱：xiali@infoobs.com

本月熱門

精選文章

熱點(diǎn)資訊

電信聯(lián)通5G迎利好!工信部發(fā)布2100MHz頻段5G基站射頻技術(shù)試行要求

Facebook利用10億張社交軟件圖片，訓(xùn)練AI新算法

2024 信息化觀察網(wǎng)

長(zhǎng)按掃描二維碼閱讀原文

Facebook利用10億張社交軟件圖片，訓(xùn)練AI新算法

最新評(píng)論（評(píng)論僅代表用戶觀點(diǎn)）

大模型時(shí)代的AI十大趨勢(shì)觀察

到2032年，汽車AI市場(chǎng)規(guī)模預(yù)計(jì)將達(dá)到311.1億美元|報(bào)告

人工智能進(jìn)入強(qiáng)監(jiān)管時(shí)代

IDC：2026年50％終端將搭載硬件AI引擎功能

本月熱門

云計(jì)算的江湖，風(fēng)云再起

揭秘，IOTE國(guó)際物聯(lián)網(wǎng)展2025年巡展預(yù)告!

防勒索病毒攻擊關(guān)鍵措施

匯聚行業(yè)精英，探討前沿技術(shù) 第十九屆汽車涂裝工藝技術(shù)研討會(huì)即將啟幕!

網(wǎng)博會(huì)革新升級(jí)：“區(qū)域頻道”精準(zhǔn)選型引領(lǐng)，引領(lǐng)智能制造新風(fēng)潮

萬(wàn)億賽道!AI算力趨勢(shì)發(fā)展深度分析 2024

精選文章

市委統(tǒng)戰(zhàn)部領(lǐng)導(dǎo)一行赴武漢大數(shù)據(jù)公司調(diào)研數(shù)據(jù)要素市場(chǎng)化發(fā)展及實(shí)踐成果

載譽(yù)而歸!歐陸通斬獲“行業(yè)領(lǐng)軍企業(yè)+行業(yè)值得信賴品牌+電源最佳產(chǎn)品”三項(xiàng)大獎(jiǎng)

WISS 2023第四屆世界物聯(lián)網(wǎng)安全及數(shù)據(jù)安全治理峰會(huì)將在上海盛大召開(kāi)

安全初創(chuàng)企業(yè)Pindrop獲得9000萬(wàn)美元融資用于預(yù)防語(yǔ)音詐騙

云尖軟件入選2023年中關(guān)村科技型小微企業(yè)關(guān)鍵技術(shù)創(chuàng)新支持項(xiàng)目（第二批）擬支持單位名單

QuestMobile2023中國(guó)移動(dòng)互聯(lián)網(wǎng)半年大報(bào)告：大廠重回快速增長(zhǎng)，11家去重用戶破5億，行業(yè)新動(dòng)能顯現(xiàn)，人群差異特性明顯

熱點(diǎn)資訊

自動(dòng)化測(cè)試有哪些常見(jiàn)的挑戰(zhàn)和解決方案？

政策寶閃耀2024數(shù)智融合應(yīng)用論壇，榮獲“數(shù)智融合標(biāo)桿案例”

共筑數(shù)字未來(lái)|深度解析數(shù)字化轉(zhuǎn)型與建設(shè)的戰(zhàn)略指南

數(shù)據(jù)要素X政策寶：引領(lǐng)企業(yè)和政策數(shù)據(jù)服務(wù)的新浪潮

政策寶|構(gòu)筑企業(yè)與政策間的高效數(shù)據(jù)通道，跑出惠企助企加速度

電信聯(lián)通5G迎利好!工信部發(fā)布2100MHz頻段5G基站射頻技術(shù)試行要求

聚焦“兩會(huì)”：智能汽車成攻擊新目標(biāo)，網(wǎng)絡(luò)安全會(huì)成為標(biāo)配嗎？

Facebook利用10億張社交軟件圖片，訓(xùn)練AI新算法

最新評(píng)論（評(píng)論僅代表用戶觀點(diǎn)）

欄目推薦

大模型時(shí)代的AI十大趨勢(shì)觀察

到2032年，汽車AI市場(chǎng)規(guī)模預(yù)計(jì)將達(dá)到311.1億美元|報(bào)告

人工智能進(jìn)入強(qiáng)監(jiān)管時(shí)代

IDC：2026年50％終端將搭載硬件AI引擎功能

本月熱門

精選文章

熱點(diǎn)資訊

電信聯(lián)通5G迎利好!工信部發(fā)布2100MHz頻段5G基站射頻技術(shù)試行要求

聚焦“兩會(huì)”：智能汽車成攻擊新目標(biāo)，網(wǎng)絡(luò)安全會(huì)成為標(biāo)配嗎？

Facebook利用10億張社交軟件圖片，訓(xùn)練AI新算法

到2032年，汽車AI市場(chǎng)規(guī)模預(yù)計(jì)將達(dá)到311.1億美元|報(bào)告

聚焦“兩會(huì)”：智能汽車成攻擊新目標(biāo)，網(wǎng)絡(luò)安全會(huì)成為標(biāo)配嗎？