品玩6月12日讯,开源Meta 克日在 Github 上开源了其 AI 语言模子 MusicGen,将文该模子基于google 2017 年推出的本及 Transformer 模子。彷佛模子称谓所示,旋律MusicGen 主要用于音乐天生,转化它可能将文本以及已经有的为残旋律转化为残缺乐曲。
研发团队展现:“咱们运用了 20000 小时的缺乐曲授权音乐来对于磨炼该模子,并接管 Meta 的开源 EnCodec 编码器将音频数据分解为更小的单元妨碍并行处置,进而让 MusicGen 的将文运算功能以及天生速率都比同规范 AI 模子加倍卓越 。”
除了此之外 ,本及MusicGen 还反对于文本与旋律的旋律组合输入,好比你可能提降天生“一首轻捷的转化曲目”并同时要求“将它与贝多芬的《悲痛颂》散漫起来” 。
研发团队还对于 MusicGen 的为残实际展现妨碍了测试 。服从展现 ,缺乐曲与google的开源 MusicLM 以及 Riffusion、Mousai 、Noise2Music 等其余音乐模子比照 ,MusicGen 在测试音乐与文本揭示的立室度以及作曲的可信度等目的上展现更好,总体而言略高于google MusicLM 的水平。