當前位置首頁 > 行業(yè) > 文化 >

音樂大模型市場“群雄逐鹿”

中國產(chǎn)業(yè)經(jīng)濟信息網(wǎng) 時間：2024-12-16

　　多樣的音樂創(chuàng)作玩法、不斷優(yōu)化的模型效果，讓音樂大模型成為今年垂直大模型賽道的一大亮點。

　　今年3月，音樂生成模型Suno V3面世，被一些業(yè)界人士稱為音樂行業(yè)的“ChatGPT時刻”。最近，Suno發(fā)布V4版本，允許用戶生成音質更高、更好聽、時長達4分鐘的音樂。這意味著，AI可以創(chuàng)作一首完整的歌曲。

　　不僅是Suno，國內(nèi)AI音樂領域的資深“玩家”們也紛紛入局。在Suno V3發(fā)布后，國內(nèi)大模型廠商紛紛上線類似產(chǎn)品，形成“群雄逐鹿”的格局。

　　產(chǎn)品層出不窮

　　記者梳理發(fā)現(xiàn)，目前國內(nèi)AI音樂大模型企業(yè)主要有三類：以字節(jié)跳動豆包旗下海綿音樂為代表的大型科技公司，以昆侖萬維旗下的天工SkyMusic為代表的新興大模型廠商，以及以趣丸科技旗下的天譜樂為代表的垂直賽道公司。

　　海綿音樂主打利用AI技術幫助用戶生成個性化音樂作品。用戶只需輸入一句靈感或上傳一張圖片，即可生成專屬音樂作品。相比Suno，海綿音樂生成的中文歌曲吐字清晰度和演唱流暢性更高，曲風更符合國人喜好。

　　天工SkyMusic基于昆侖萬維“天工3.0”超級大模型打造，能夠生成多種風格的音樂作品。它采用音樂音頻領域類Sora模型架構，支持生成80秒44100赫茲采樣率雙聲道立體聲歌曲。

　　天譜樂于今年7月發(fā)布，是一個多模態(tài)配樂大模型。它集成圖片理解算法、旋律生成算法、視頻理解算法、配器識別算法等技術。值得注意的是，天譜樂不僅支持文生音樂、音頻生音樂，還具備圖片、視頻生成音樂的功能。

　　此外，騰訊音樂和網(wǎng)易云音樂也推出了相關產(chǎn)品。

　　落地場景廣泛

　　業(yè)內(nèi)普遍認為，與全球巨頭同場競技，AI應用是國內(nèi)人工智能企業(yè)的優(yōu)勢所在。國內(nèi)市場需求大、可落地的商業(yè)化場景多，為國產(chǎn)大模型進化提供了堅實基礎。

　　在趣丸科技副總裁賈朔看來，“降低門檻讓普通用戶體驗音樂創(chuàng)作的樂趣”是自研產(chǎn)品的出發(fā)點，而這樣的策略也的確奏效。數(shù)據(jù)顯示，目前已有4600萬人注冊使用趣丸科技旗下的唱鴨App或天譜樂官網(wǎng)，累計創(chuàng)作近1000萬首AI歌曲。

　　影視制作等專業(yè)從業(yè)者的應用，也為音樂大模型落地提供了更多商業(yè)化場景。一方面，音樂大模型可以幫助專業(yè)音樂人提升創(chuàng)作效率，讓快速創(chuàng)作和試驗新的音樂構想成為可能；另一方面，在短視頻浪潮下，音樂大模型正在輔助短視頻創(chuàng)作者創(chuàng)造出更符合視頻內(nèi)容的背景音樂，提升內(nèi)容質量和受眾體驗。

　　推廣遭遇挑戰(zhàn)

　　盡管音樂大模型在以前所未有的速度“狂飆”，但推廣應用尚面臨一些難題。

　　高質量的音樂生成模型依賴高質量的音樂音頻數(shù)據(jù)進行訓練，但這些音樂音頻數(shù)據(jù)的版權問題不容忽視。今年6月，環(huán)球音樂集團、索尼音樂集團和華納音樂集團等多家唱片公司對Suno等AI音樂公司發(fā)起訴訟，稱它們未經(jīng)授權使用版權音樂來訓練AI模型并對外提供服務。對此，Suno進行回擊，指責唱片公司濫用版權訴訟，企圖借此維護自己在AI音樂市場的主導地位。如何在法律框架內(nèi)實現(xiàn)高質量音樂音頻數(shù)據(jù)的運營和商業(yè)化，是AI音樂公司未來必須思考的問題。此外，音樂大模型生成的音樂作品是否享有版權保護，其版權歸屬如何界定，尚無明確的法律規(guī)定，這給音樂大模型的應用帶來了不確定性。

　　賈朔認為，可以利用技術手段規(guī)避一些紛爭。比如在產(chǎn)品側，當用戶在使用AI創(chuàng)作時，可利用相關技術判斷其是否有模仿現(xiàn)有藝術家作品的主觀意圖，并視情況做出彈窗提示。

　　同時，音樂的創(chuàng)意與情感是否可以被大模型實現(xiàn)也有待驗證。如何提升大模型的創(chuàng)意能力，使其能創(chuàng)作出更具個性和創(chuàng)新性的音樂作品，是當前音樂大模型需要突破的方向之一。

　　此外，AI音樂“演唱者”的聲音距離真人也有一定距離，解決這一問題需要相應的技術手段。昆侖萬維董事長方漢說，天工SkyMusic通過自研模型技術，實現(xiàn)樂器、人聲、旋律、音量、音符的一體化端到端生成，在人聲合成、情感表達等方面具有一定優(yōu)勢。（記者崔爽）

　　轉自：科技日報

返回產(chǎn)經(jīng)網(wǎng)首頁 >>

　　【版權及免責聲明】凡本網(wǎng)所屬版權作品，轉載時須獲得授權并注明來源“中國產(chǎn)業(yè)經(jīng)濟信息網(wǎng)”，違者本網(wǎng)將保留追究其相關法律責任的權力。凡轉載文章及企業(yè)宣傳資訊，僅代表作者個人觀點，不代表本網(wǎng)觀點和立場。版權事宜請聯(lián)系：010-65363056。

延伸閱讀

熱點視頻

上半年汽車工業(yè)多項經(jīng)濟指標創(chuàng)新高

熱點新聞

音樂大模型市場“群雄逐鹿”

熱點視頻

熱點新聞

微信公眾號