AI作曲的諾亞方舟將去往何處

智能相對論 /黃康瑄
隨著人工智能相關技術的發(fā)展和普及,近年來,越來越多企業(yè)和機構開始研究這個科技與藝術結合的奇妙領域,各式各樣的作曲算法不斷涌現,不少虛擬音樂人展露頭角。

10月8日,韓國新人歌手夏妍發(fā)布了由人工智能作曲機器人EvoM制作的單曲《Eyes on you》,成為全世界第一位憑借AI作曲出道的人類歌手。

EvoM是韓國光州科學技術院人工智能研究生院研發(fā)的韓國首個人工智能作曲機器人,在《Eyes on you》的錄制中負責作曲、編曲工作。EvoM的研發(fā)者安昌旭表示,他的目標是讓人工智能創(chuàng)作的歌曲登上K-POP排行榜。

啟航-音樂生產自動化的野心

早在上個世紀,人類就開始探討計算機獨立制作音樂的可能性。1956年,在列哈倫·希勒(Lejaren Hiller)的研究室里,世界上第一首完全由計算機生成的音樂作品--弦樂四重奏《伊利亞克組曲》(Illiac Suite)誕生了。1995年,阿爾佩(Alpern)研發(fā)的EMI作曲系統(tǒng)也是較早的一個成熟的古典音樂作曲系統(tǒng),該系統(tǒng)主要采用拼接的方式來創(chuàng)作再現已故作曲家音樂風格的作品,其中有類巴赫的創(chuàng)意曲、器樂協奏曲和組曲,還有類莫扎特的奏鳴曲以及類肖邦的夜曲。

隨著人工智能相關技術的發(fā)展和普及,近年來,越來越多企業(yè)和機構開始研究這個科技與藝術結合的奇妙領域,各式各樣的作曲算法不斷涌現,不少虛擬音樂人展露頭角。“智能相對論”梳理了下:

2016年,Google公司研發(fā)的機器學習項目馬真塔(Magenta studio)通過神經學習網絡創(chuàng)作出一首時長90秒的鋼琴曲。同年,Sony旗下的計算機科學實驗室(Computer Science Laboratories,簡稱Sony CSL)開發(fā)了Flow Machines平臺。Flow Machines利用馬爾科夫鏈分析數據庫中現存的歌曲,提取旋律及和弦的關鍵信息,利用這些關鍵信息作為變量來學習音樂風格,讓不同風格的歌曲相互轉換、融合,并加以優(yōu)化,其代表作是一首披頭士音樂風格的歌曲《爸爸的汽車》(Daddy's Car)。此外,Sony CSL還開發(fā)了一個名為“DeepBach(深度巴赫) ”的神經網絡,利用巴赫創(chuàng)作的352部作品來訓練DeepBach,最終完成2503首贊美詩的創(chuàng)作。

第一個正式獲得世界地位的AI虛擬作曲家則是2016年誕生的AIVA(Artificial Intelligence Virtual Artist)。AIVA通過讀取由莫扎特、巴赫、貝多芬等名家譜寫的15000首曲子進行學習,利用深度學習技術,搭建體現它自己對音樂理解的數學模型,運用模型創(chuàng)作出完全原創(chuàng)的曲子。作為虛擬音樂人,AIVA已通過法國和盧森堡作曲家協會(SACEM)的合法注冊,成為該協會首位非人類會員,并擁有自己的署名版權。

今年2月,美國數字研究機構Space150模仿知名說唱歌手Travis Scott的人聲和音樂風格,做出了說唱機器人Travis Bott。這是一個關于人工智能創(chuàng)造性的實驗,研發(fā)團隊采用附加神經網絡技術(Additional Neural Network),創(chuàng)造出“Travis Scott味”的旋律和打擊樂伴奏,再將Travis Scott的歌詞輸入“文本生成器模型(Text Generator Model)”,得到了機器自動仿照Travis風格生成的歌詞。于是,Travis Bott完成了自己的創(chuàng)作--《Jack Park Canny Dope Man》。最后,研發(fā)團隊使用基于AI的人體圖像合成技術“Deepfake”,為這首歌拍攝了MV。就樂曲效果而言,Travis Bott對Travis Scott的模仿幾乎以假亂真,完全融匯了Travis Scott作品以及人物魅力最主要的外部特征。同時,該項目也進一步驗證了人工神經網絡技術(Artificial Neural Networks)的蓬勃發(fā)展,有助于探索未來AI在音樂中的應用價值。

造船原理-幾種算法模型

現代人工智能作曲技術背后蘊含了多種算法模型的結合運用,包含人工神經網絡、馬爾科夫鏈及遺傳算法等。如AIVA和Travis Bott就使用了一種基于人工神經網絡的深度學習技術。

人工神經網絡是一種對生物神經的網絡行為特征進行模仿,開展分布式并行信息處理的算法數學模型。程序員必須搭建一個多層“神經網絡”,在多層的結構中分別加以編程,從而處理各種輸入和輸出點之間的信息。作品數據輸入后,人工神經網絡會找到眾多被輸入作品之間存在的規(guī)律,繼而形成對音樂旋律、節(jié)奏、音高、強弱變化的理解與學習。這種學習的主要目的是用來預測,并非就此生成作品。AI程序會帶著它對以上音樂風格的預測繼續(xù)運行,并將在前方遇到下一個驗證數據集。這個數據集會判定它的預測是否正確,正確與錯誤的回饋都將被AI記住。

在不斷的高速學習中,AI的預測能力就會越來越強,最終掌握程序員大數據歸總后的曲風,進而編寫出自己的曲子。人工神經網絡為從前的算法作曲提供了一種新的方式,其優(yōu)勢在于能夠對音樂作品的全局性特征進行學習,但是需采用大量的樣本進行訓練。當下國內外有許多基于該種算法所形成的人工智能作曲系統(tǒng),如LSTM神經網絡,可以確保所創(chuàng)作音樂的完整性。

除了人工神經網絡,馬爾科夫鏈(Markov Chain)也一直被廣泛地應用于算法作曲領域。馬爾科夫鏈是一種隨機選擇過程,主要用于產生一段具有一定風格的旋律。就像按照一個特定的標準人為構造制定的轉換表來依次選擇音符,計算并選擇下一個要出現音符的可能性。這種方法可以模擬作曲家創(chuàng)作音樂時的思維,來控制計算機生成相應的音樂作品,但是整部作品的曲式結構無法通過馬爾科夫鏈建模。遺傳算法(Genetic Algorithm)則是模仿生物進化過程的智能計算方法,使用適應性函數來演化樣本、優(yōu)化全局。

其中,變異算子可以模擬人在其創(chuàng)作當中靈感的閃現,相當于留下最具代表性的作品來產生新的旋律。該算法的壁壘在于適應性函數的設計至今尚無統(tǒng)一標準。

版權的“暗礁” 依然是AI作曲要面臨的主要問題

由于AI音樂的產生是根據算法模型,讓計算機在大量現成作品中尋求“規(guī)律”,按照這些規(guī)律提取資料中特定的樂章片段,依據計算得出的概率重新進行排列組合,故人工智能作曲必然涉及到資料庫中大量現成作品的版權問題。

AI如何判斷研究人員提供的曲庫中哪些作品收到版權保護?AI作曲成果是否侵犯學習對象的版權?如AIVA最初以古典音樂為學習對象,它所使用的莫扎特、貝多芬等人的作品歷史久遠,版權時效已過,故沒有此類問題。AIVA研發(fā)人員特意選擇古典音樂為其學習對象,主要就是為了避免版權問題。但像Travis Bott所用的Travis Scott人物及作品相關資料皆需取得授權,而Travis Bott在此基礎上創(chuàng)作的作品算不算對Travis Scott的抄襲?音樂作品抄襲的議題屢見不鮮,相關討論仍然不時出現,至今依然沒有統(tǒng)一、明確的判斷標準。從版權問題可見,現在的人工智能作曲技術依托于算法,受限于曲庫的音樂“規(guī)則”,還無法產生突破既有規(guī)律的作曲創(chuàng)意,此為AI作曲面臨的另一個技術難題。

即便AI作曲技術經過不斷優(yōu)化,最終得以生產出純原創(chuàng)、不涉及任何侵權的作品,此作品又將面臨到版權認證的問題。隨著AI創(chuàng)作相關技術的成熟與普及,一些國家開始在法律上明確界定AI作品的版權歸屬。

1988年,英國正式頒布了《版權、設計和專利法案》(Copyright,Designs and Patents Act 1988),其中,對于計算機創(chuàng)作的內容進行了明確的規(guī)定:“為計算機所生成之作品進行必要程序者,視為該計算機生成之作品的作者,其保護期限是自作品完成創(chuàng)作之年的最后一日起50年后屆滿”。規(guī)定AI作品的版權屬于“進行必要程序者”,同時也明確界定了對計算機生成作品“進行必要程序者”,即包括程序員、使用者,也可能是人工智能系統(tǒng)或設備的投資者。

2017年,世界知識產權組織(WIPO)雜志提到:如果一部作品的創(chuàng)作過程中“人類的參與有限,或根本沒有人類參與”,著作權法可以有兩種潛在的生效方式--著作權法可以“拒絕”對計算機生成的作品進行版權保護,也可以將此類作品的作者歸屬于程序的創(chuàng)建者?,F在國內解決此類問題也基本沿襲這個思路。

2018年,上海一家公司未經過授權,將騰訊開發(fā)的自動化編寫程序Dream writer生成的財務報告復制到該公司網站。深圳市南山區(qū)法院裁定,該公司因侵犯騰訊的版權而需承擔民事責任,向騰訊公司賠償1500元人民幣。中國現行的《著作權法》尚未明確界定AI作品的版權歸屬,這一裁定可能是AI創(chuàng)作領域的重要里程碑?!吨鳈喾ā?“著作權是著作權法賦予民事主體對作品及相關客體所享有的權利。”其中,民事主體指公民、法人或非法人組織?!吨鳈喾ā繁Wo的對象是作為民事主體的獨創(chuàng)性思想表達,并非民事主體的AI無法單獨享有著作權,但只要在作者名錄加上人類作曲家或研發(fā)者的名字就能解決此問題。人工智能雖無法成為受法律保護的主體,但對其作品版權的保護也開始受到法律認可。

沒有感情的輔助器-方舟的航向

人工智能作曲技術的日漸成熟,在音樂行業(yè)掀起一股不小的浪潮。盡管人工智能已經實現通過讀取、記憶大量樂曲獲取規(guī)律,計算音符節(jié)奏的出現概率并排列組合來“創(chuàng)造”音樂。但音樂的核心并非音樂本身而是“人”,音樂源于人類情感流動?!抖Y記·樂記》對音樂起源的解釋非常貼切:“凡音之起,由人心生也。人心之動,物使之然也。感于物而動,故形于聲;聲相應,故生變;變成方,謂之音。”作曲家和演奏者透過旋律、節(jié)奏表達的情緒與觀眾聆聽音樂引起的共鳴,這種藉由音符實現的,跨越時間、空間與種族的情感交流才是音樂存在的意義,也是莫扎特、貝多芬等音樂家流芳百世的根本原因。

從某種角度來說,由于音樂是人類抒發(fā)心情的一種方式,讓沒有感情的人工智能作曲或許可以說是一個偽命題。人工智能不具備情感,不了解音符、節(jié)奏等音樂表層結構和基于情緒表達的音樂深層邏輯之對應關系,其制作的音樂只是基于概率所排列的音符。無論算法作曲技術發(fā)展得多么成熟,音樂作為人類情感交流的藝術形式之一,AI所作的樂曲必然無法完全取代人類音樂作品在社會中的功能和角色,人工智能也無法替代行業(yè)內頂尖的音樂創(chuàng)作者及表演者。不僅是音樂,在美術、文學等藝術創(chuàng)作中皆是如此。

現在較為成熟的AI音樂公司除了Google、Sony、AIVA外,還有英國的AI Musical、德國的Melodrive、美國的Humtap、Popgun、Snafu Records及諸多硅谷大亨聯合建立的人工智能非營利組織OpenAI、字節(jié)跳動旗下的Jukedeck等。百度、騰訊、阿里、網易云等音樂平臺都在不同程度上對人工智能音樂有布局。即便人工智能暫時無法掌握樂曲中細膩的情感變化及流動,但基于計算機具備對大量作品進行數據處理、運算分析及排列組合的強大能力,使得人工智能編曲效率遠遠高于人類。在一些注重成本且審美要求不高的應用場景中,AI作曲占有明顯的優(yōu)勢。因此,一批專業(yè)度不足的音樂從業(yè)者可能面臨被淘汰的命運。

目前,人工智能作曲技術逐漸往商業(yè)應用與輔助創(chuàng)作的方向發(fā)展,“智能相對論”看到,其應用場景主要為視頻配樂、游戲配樂、電視預告片、商業(yè)廣告、發(fā)布會和電影等方面。

以非藝術場景的商用音樂為主要市場,打破了固有音樂市場關于成本及創(chuàng)作時間的限制。如上文提及的AIVA已開始為電影、視頻、電視劇制作音樂。微軟(亞洲)互聯網工程院開發(fā)的小冰樂隊能自動生成旋律和編曲框架,已為2020世界人工智能大會創(chuàng)作了主題曲《智聯家園》。由西電灃東人工智能與類腦感知產業(yè)技術研究院研發(fā)的Muses人工智能作曲系統(tǒng),基于GAN和LSTM的智能譜曲算法和視頻多元素提取算法,實現了視頻自助譜曲、智能仿曲和譜曲輔助智能等功能。通過對視頻進行內容物體識別、色彩分析和畫面節(jié)奏分析,生成合適的背景音樂;也可透過用戶輸入的仿曲或關鍵詞、語句啟發(fā)音符,產生類似風格的音樂。另有一款專門制作視頻配樂的AI Ecrett Music,通過識別不同的視頻主題、時間及情緒,對視頻配樂進行個性化編輯,為視頻制作者持續(xù)產生不同的音律。為創(chuàng)意要求較低、對價格較敏感的部分商業(yè)音樂創(chuàng)作提供了全新解決方案。

除此之外,人工智能作曲技術對音樂愛好者進行創(chuàng)作也起到了輔助作用。

2019年上線的“哼趣”APP就是一款基于人工智能的音樂創(chuàng)作工具,只需簡單哼唱,AI就會根據哼唱內容、音調、旋律生成一段完整的、悅耳的曲子,此外,還可對生成的曲子進行個性化編輯,一鍵選擇變換不同樂器、風格與時長。“哼趣”的核心原理是通過大量的樂曲訓練來形成一套完善的LSTM神經網絡的方式。同時,算法團隊解決了MP3與MIDI格式的相互轉換和降噪問題,將人聲與機器可識別的MIDI語言進行轉化,再利用帶有音頻判定的神經網絡進行樂曲生成。使用這類軟件或APP,不僅使得音樂創(chuàng)作更加便利快捷,也大大降低了普羅大眾創(chuàng)作音樂的門檻。對專業(yè)音樂人而言,比起原先需要通過MIDI鍵盤輸入旋律的創(chuàng)作形式,在很大程度上提升了工作效率,減少重復勞動,并降低了與制作方的溝通成本。人工智能作曲隨機生成的旋律也能在創(chuàng)作陷入瓶頸時,為使用者提供靈感,編曲工具的發(fā)展將使專業(yè)作曲家的創(chuàng)造力得到進一步釋放。

結語

AI作曲技術讓音樂產業(yè)鏈運作更有效率,人工智能創(chuàng)作的歌曲登上K-POP排行榜也許不再是天方夜譚。技術革新既是挑戰(zhàn),也是機會??萍嫉倪M步促使人類在探索更多可能性的同時,也重新審視自己的價值。

(以上圖源皆來自網絡)

參考資料:

1. 周莉,鄧陽《人工智能算法作曲發(fā)展的現狀和趨勢研究》,《藝術探索》,2018年9月

2. 毛康,林勇《人工智能作曲發(fā)展的現狀探討》,《山西青年》,2019年7月

3. 機器之心《不會音樂也能作曲?AI開啟智能音樂創(chuàng)作》

4. 任夢巖《當AI開始作曲 還有啥不可能的?》

5. 中國新聞社《科班畢業(yè),兩分鐘寫首歌......AI歌手來了,人類還能做什么?》

6. 范正輝《在AI面前,Rapper要率先失業(yè)了?》

7. 木槿淺藏心《人工智能與音樂創(chuàng)作》

此內容為【智能相對論】原創(chuàng),

僅代表個人觀點,未經授權,任何人不得以任何方式使用,包括轉載、摘編、復制或建立鏡像。

部分圖片來自網絡,且未核實版權歸屬,不作為商業(yè)用途,如有侵犯,請作者與我們聯系。

智能相對論(微信ID:aixdlun):

AI產業(yè)新媒體;

今日頭條青云計劃獲獎者TOP10;

澎湃新聞科技榜單月度top5;

文章長期“霸占”鈦媒體熱門文章排行榜TOP10;

著有《人工智能 十萬個為什么》

【重點關注領域】智能家電(含白電、黑電、智能手機、無人機等AIoT設備)、智能駕駛、AI+醫(yī)療、機器人、物聯網、AI+金融、AI+教育、AR/VR、云計算、開發(fā)者以及背后的芯片、算法等。

THEEND

最新評論(評論僅代表用戶觀點)

更多
暫無評論