繼聊天機器人 ChatGPT、AI 影片模型 Sora 後,OpenAI 又將擴展 AI 應用版圖,最新傳出該公司正積極開發 AI 音樂模型。
據悉,OpenAI 工程師正與茱莉亞音樂學院學生合作,為音樂樂譜進行標註,作為訓練數據基礎。團隊在內部討論中已探討透過文本或音頻提示生成音樂的場景,例如輸入描述為現有聲樂曲目添加吉他伴奏,此功能也許能協助用戶為短影音自動配樂,搭配 Sora 生成的舞蹈影片,再分享至 ChatGPT 團隊開發的 AI 社交平台,大幅降低內容創作門檻。
目前 OpenAI 擁有超過 8 億活躍用戶,音樂模型將助其構建更完整的 AI 生態系,提升用戶黏著度。
但 AI 音樂模型是否會跟 ChatGPT 或 Sora 無縫整合,或獨立成應用,OpenAI 發言人仍不願置評。
除個人娛樂外,音樂模型也瞄準商用市場,廣告業者未來或可借此生成廣告歌詞與旋律,拓展商業變現路徑。
事實上,OpenAI 早於 2019 年推出音樂生成模型 MuseNet,能結合 10 種樂器生成 4 分鐘古典、搖滾等風格樂曲,卻無法歌唱,隔年再發布會「唱歌」的 Jukebox,但因技術與算力限制,生成效果與人類創作仍有差距,且均未整合至現有產品。
全球 AI 音樂賽道已呈現百花齊放。今年 5 月,谷歌推出第二代音樂模型 Lyria,強調可用於廣告配樂,與 OpenAI 商用方向重疊。
成立三年的新創公司 Suno 的每年經常性收入已達 1.5 億美元,較一年前成長近 400%,顯示市場潛力。
中國廠商亦加速佈局,字節跳動去年推出具靈活控制的 Seed-Music,阿里巴巴通義實驗室今年初也開源 InspireMusic,整合生成、歌曲與音頻能力,崑崙萬維 3 月發布全球首款音樂推理大模型 Mureka O1,性能超越 Suno V4,騰訊 AI Lab 6 月開源 SongGeneration,專攻音質、音樂性與生成速度;MiniMax 上月也上線 Music1.5,強化人聲自然度與編曲層次。
從 OpenAI 的技術迭代到全球廠商的爭相投入,AI 音樂正從實驗走向應用,預計將掀起新一輪技術與商業的深度競逐。
新聞來源 (不包括新聞圖片): 鉅亨網