過去幾年里,人工智能(AI)在創(chuàng)意領域的應用出現(xiàn)了爆炸性增長。新一代圖像和文本生成器不斷給人驚喜?,F(xiàn)在,AI正在下一個領域掀起浪潮。
近期,谷歌的一個研究團隊發(fā)布了新的AI模型MusicLM,這是一種可將文本信號轉換為音頻片段的音樂生成器。繼ChatGPT之后,音樂或將成為AI生成的前沿領域。這是創(chuàng)意AI在短短幾年內(nèi)創(chuàng)新步伐飛速的又一個例子。
傳統(tǒng)音樂行業(yè)仍在適應互聯(lián)網(wǎng)和流媒體服務帶來的巨大沖擊,AI會改變?nèi)藗儎?chuàng)作和體驗音樂的方式,使音樂行業(yè)再次復興嗎?
把文字變音樂的AI“藝術家”
最近爆火的聊天機器人ChatGPT或許還無法制作音樂,但谷歌的MusicLM可以。
這一AI“藝術家”可根據(jù)不同地點、時代或要求創(chuàng)作音樂。其樣本由指定音樂流派、音樂氣氛甚至特定樂器的長段旋律組成。
當MusicLM“聽到”某人吹口哨、哼唱、演唱或是演奏樂器后,能從中推斷出額外的旋律小節(jié)。它可調(diào)節(jié)樂器的種類,甚至是演奏的力度。它還可創(chuàng)建一曲連續(xù)音樂即興表演的“故事”,例如創(chuàng)作“在電子游戲中播放的電子歌曲”“在河邊播放的冥想歌曲”、表達意境為“火”和“煙花”等音樂。
MusicLM甚至可產(chǎn)生適合視覺藝術的聲音。例如,它根據(jù)薩爾瓦多·達利的名畫《記憶的永恒》和雅克-路易·大衛(wèi)的《跨越阿爾卑斯山圣伯納隘道的拿破侖》的描述創(chuàng)建了配樂。
AI生成音樂史上的重要突破
AI生成音樂有著悠久的歷史,甚至被認為是創(chuàng)作熱門歌曲和助力現(xiàn)場表演的“功臣”。
在MusicLM之前,已經(jīng)有其他嘗試利用AI生成音樂的嘗試,比如谷歌發(fā)布的AudioML和OpenAI的Jukebox,視覺和聲音AI項目Riffusion則使用穩(wěn)定擴散將文本提示轉換為聲圖。還有一些AI工具可將生成式AI和音樂結合在一起,比如Voicesmod的合成歌曲生成器,它可將提交的歌詞與一系列流行歌曲和AI聲音進行匹配。
不過,谷歌研究人員在論文中也提到了AI音樂生成面臨的各種挑戰(zhàn)。相比從文本到圖像的機器學習,缺乏配對的音頻和文本數(shù)據(jù)是一大障礙。此外,音樂是“沿著時間維度”構建的,讓AI了解文本表達的意圖,創(chuàng)作出一段符合主題的持續(xù)的音樂要困難得多。
MusicLM是克服挑戰(zhàn)的重要一步。據(jù)極客邦科技網(wǎng)站報道,MusicLM將有條件的音樂生成過程建模,變?yōu)榉謱有蛄械叫蛄薪?,也就是說,它使用機器學習為歌曲的不同層次生成序列,如結構、旋律和單獨的聲音,并在幾分鐘內(nèi)以恒定的24千赫茲創(chuàng)建音樂。http://m.sxtianfeng.com