2月20日消息,據(jù)媒體報(bào)道,谷歌宣布,其Gemini應(yīng)用正式集成DeepMind旗下最先進(jìn)的音樂(lè)生成模型Lyria 3,用戶僅憑一句文字描述或一張照片,即可在數(shù)秒內(nèi)生成一段30秒的完整音樂(lè)片段。
據(jù)谷歌介紹,Lyria 3的創(chuàng)作方式靈活多樣:用戶可以“描述一個(gè)想法”,比如指定某種風(fēng)格、情緒或節(jié)奏,模型便能自動(dòng)生成包含人聲、歌詞和伴奏的歌曲;也可以上傳照片或視頻,Lyria 3會(huì)分析畫(huà)面氛圍,創(chuàng)作出契合場(chǎng)景的配樂(lè),并配有由Nano Banana設(shè)計(jì)的自定義封面。
此外,YouTube創(chuàng)作者還可通過(guò)Dream Track功能探索Lyria 3,為Shorts短視頻配樂(lè),該功能已在美國(guó)推出,并逐步推廣至其他地區(qū)。

消息公布后,歐美流媒體音樂(lè)平臺(tái)Spotify股價(jià)一度回吐日內(nèi)近5%的漲幅,Sirius XM也短暫轉(zhuǎn)跌。有分析認(rèn)為,雖然Lyria 3短期內(nèi)不會(huì)對(duì)Spotify構(gòu)成致命沖擊,但可能倒逼其加快推出AI混音功能。
對(duì)于谷歌而言,將音頻生成工具融入移動(dòng)應(yīng)用,既增強(qiáng)了消費(fèi)者產(chǎn)品的競(jìng)爭(zhēng)力,也向投資者展示了其AI投入的變現(xiàn)潛力。
若用戶提示中提及真實(shí)音樂(lè)人,Gemini只會(huì)將其視為“廣泛的創(chuàng)作靈感來(lái)源”,生成風(fēng)格或氛圍相似的作品,并設(shè)有過(guò)濾器防止輸出侵權(quán)內(nèi)容。同時(shí),所有生成的曲目均使用SynthID技術(shù)添加了不易察覺(jué)的水印,便于檢測(cè)AI創(chuàng)作內(nèi)容。
生成式AI在音樂(lè)行業(yè)始終面臨謹(jǐn)慎甚至敵視的態(tài)度,許多從業(yè)者擔(dān)憂其可能威脅商業(yè)模式和知識(shí)產(chǎn)權(quán)。谷歌此次通過(guò)技術(shù)手段明確劃定邊界,試圖在創(chuàng)新與保護(hù)之間尋求平衡。
目前Lyria 3已向全球18歲以上用戶開(kāi)放,支持英語(yǔ)、德語(yǔ)、西班牙語(yǔ)、法語(yǔ)、印地語(yǔ)、日語(yǔ)、韓語(yǔ)、葡萄牙語(yǔ)等語(yǔ)言,未來(lái)還將擴(kuò)展更多語(yǔ)言并提升生成質(zhì)量。
