AI作畫(huà)大受追捧,生成式AI技術(shù)的機(jī)會(huì)與挑戰(zhàn)!

生成式AI是指利用現(xiàn)有文本、音頻文件或圖像等創(chuàng)建新內(nèi)容的技術(shù)。生成式AI可從其數(shù)據(jù)中學(xué)習(xí)內(nèi)容或?qū)ο螅⑦\(yùn)用數(shù)據(jù)生成全新的、完全原創(chuàng)的、逼真的工件,留下與訓(xùn)練數(shù)據(jù)相似的特征,不是簡(jiǎn)單的重復(fù)。

本文來(lái)自電子發(fā)燒友網(wǎng),作者/李彎彎。

生成式AI是指利用現(xiàn)有文本、音頻文件或圖像等創(chuàng)建新內(nèi)容的技術(shù)。生成式AI可從其數(shù)據(jù)中學(xué)習(xí)內(nèi)容或?qū)ο?,并運(yùn)用數(shù)據(jù)生成全新的、完全原創(chuàng)的、逼真的工件,留下與訓(xùn)練數(shù)據(jù)相似的特征,不是簡(jiǎn)單的重復(fù)。

生成式AI的關(guān)鍵技術(shù)是生成式對(duì)抗網(wǎng)絡(luò)(GANs,Generative Adversarial Networks),其本質(zhì)是一種深度學(xué)習(xí)模型,是近年來(lái)復(fù)雜分布上無(wú)監(jiān)督學(xué)習(xí)最具前景的方法之一。

在原理上,生成式對(duì)抗網(wǎng)絡(luò)使用兩個(gè)神經(jīng)網(wǎng)絡(luò)相互對(duì)立,一個(gè)生成器和一個(gè)判別器。生成器或生成網(wǎng)絡(luò),負(fù)責(zé)生成類(lèi)似于源數(shù)據(jù)的新數(shù)據(jù)或內(nèi)容,判別器或判別網(wǎng)絡(luò)則負(fù)責(zé)區(qū)分源數(shù)據(jù)和生成數(shù)據(jù)。經(jīng)過(guò)交替周期訓(xùn)練,生成器不斷學(xué)習(xí)生成更逼真的數(shù)據(jù),判別器則更善于區(qū)分假數(shù)據(jù)和真實(shí)數(shù)據(jù)。漸漸地,雙方在對(duì)抗中不斷完善。

AI作畫(huà)是生成式AI的典型應(yīng)用案例。今年9月15日,一位國(guó)外游戲設(shè)計(jì)師的作品《太空歌劇院》奪得美國(guó)科羅拉多州博覽會(huì)藝術(shù)比賽數(shù)字類(lèi)別的一等獎(jiǎng)。這幅畫(huà)作完全由AI繪圖軟件根據(jù)文字指令生成。

近年來(lái)市面上涌現(xiàn)出了多款A(yù)I繪畫(huà)工具。比如由谷歌推出的Disco Diffusion,這是一款最早流行起來(lái)的AI繪圖工具。使用這個(gè)AI繪畫(huà)工具,僅僅通過(guò)文字輸入,就能輸出相應(yīng)的圖片。

還有Midjourney,這家公司名稱(chēng)也是Midjourney,創(chuàng)始人是David Holz,Midjourney是一款輸入文字就可以生成高質(zhì)量圖像的AI畫(huà)畫(huà)軟件,速度達(dá)到1分鐘出4張圖。很多藝術(shù)家會(huì)使用Midjourney生成自己想要圖像作為創(chuàng)作靈感參考。

還有由OpenAI開(kāi)發(fā)DALL·E2,這款A(yù)I繪畫(huà)工具,幾分鐘就能創(chuàng)建高度逼真的圖像。OpenAI稱(chēng),該工具可用于創(chuàng)建插圖、設(shè)計(jì)產(chǎn)品。OpenAI是在美國(guó)成立的一家人工智能研究公司。OpenAI由伊隆·馬斯克(Elon Musk)和薩姆·奧特曼(Sam Altman,現(xiàn)任OpenAI CEO)于2015年共同創(chuàng)立,后馬斯克在2019年離開(kāi)了OpenAI。

前不久國(guó)內(nèi)也上線了一個(gè)微信小程序——盜夢(mèng)師,這是一個(gè)能根據(jù)輸入文本生成圖片的AI平臺(tái),由藍(lán)振忠博士帶領(lǐng)的西湖大學(xué)深度學(xué)習(xí)實(shí)驗(yàn)室和西湖心辰科技有限公司共同推出。

據(jù)介紹,用戶(hù)輸入文字描述后,盜夢(mèng)師便可生成1:1、9:16和16:9三種比例的圖片,還有24種繪畫(huà)風(fēng)格可以選擇,除了基礎(chǔ)的油畫(huà)、水彩、素描等繪畫(huà)種類(lèi),還包括賽博朋克、蒸汽波、像素藝術(shù)、吉卜力和CG渲染等特別風(fēng)格。

除了AI作畫(huà),生成式AI的應(yīng)用案例還包括生成音頻、生成視頻、生成文本、醫(yī)療保健等,行業(yè)分析師預(yù)計(jì),這種技術(shù)將被廣泛用于各行各業(yè),并產(chǎn)生數(shù)萬(wàn)億美元的經(jīng)濟(jì)價(jià)值。Gartner發(fā)布的2022年AI技術(shù)成熟度曲線顯示:生成式AI、AI大模型等技術(shù)在萌芽2年多后已快速步入期望膨脹階段。

生成式AI的發(fā)展可能會(huì)使云服務(wù)商和芯片廠商受益。生成式AI是計(jì)算密集型技術(shù),據(jù)了解,Meta和谷歌已經(jīng)聘請(qǐng)?jiān)擃I(lǐng)域諸多杰出人才,希望將這種先進(jìn)技術(shù)整合到公司的產(chǎn)品中。

今年9月,Meta公司首次推出Make-A-Video。Make-A-Video是Meta內(nèi)部開(kāi)發(fā)的人工智能系統(tǒng),可以以利用給定的幾個(gè)詞或幾行文字生成一個(gè)幾秒鐘的短視頻。最近,谷歌也發(fā)布了名為Phenaki的程序代碼,可以將文本轉(zhuǎn)換為時(shí)長(zhǎng)幾分鐘的視頻。

生成式AI需要英偉達(dá)、AMD、英特爾等的芯片支持,進(jìn)行AI模型訓(xùn)練和部署。英偉達(dá)首席執(zhí)行官黃仁勛在日前的會(huì)議上談到,生成式AI是公司最新芯片的關(guān)鍵用途。

不過(guò)生成式AI也面臨一些挑戰(zhàn),比如AI繪畫(huà)的原創(chuàng)性和所有權(quán)的問(wèn)題,今年8月29日,一個(gè)名叫mimic的AI繪畫(huà)網(wǎng)站上線了測(cè)試版,允許用戶(hù)上傳15至100張圖像讓AI進(jìn)行學(xué)習(xí),然后輸出相同畫(huà)風(fēng)的AI畫(huà)作。然而一些未經(jīng)授權(quán)的畫(huà)作也被上傳學(xué)習(xí),把AI生成的畫(huà)作當(dāng)做自己的創(chuàng)作進(jìn)行售賣(mài)。AI作畫(huà)需要利用大量現(xiàn)有圖像進(jìn)行培訓(xùn),現(xiàn)如今,原始圖像的創(chuàng)建者是否對(duì)原創(chuàng)風(fēng)格生成的圖像擁有版權(quán)仍在爭(zhēng)論中。

THEEND

最新評(píng)論(評(píng)論僅代表用戶(hù)觀點(diǎn))

更多
暫無(wú)評(píng)論