热搜: 佳士科技irobot开云电竞官网下载app机器人机器人产业联盟ABB发那科机械手码垛机器人机器人展览

Meta 开源 AI 语言模型 MusicGen,可将文本和旋律转化为完整乐曲

日期:2023-06-13 来源:IT之家 评论:0
标签: AI 科技 创新
  me ta近日在Github上开源了其AI语言模型MusicGen,该模型基于谷歌2017年推出的Transformer模型。如同模型名称所示,MusicGen主要用于音乐生成,它可以将文本和已有的旋律转化为完整乐曲。
89f1e66d-61f6-493a-ae7d-2399da4100f5
  研发团队表示:“我们使用了20000小时的授权音乐来对训练该模型,并采用me ta的EnCodec编码器将音频数据分解为更小的单元进行并行处理,进而让MusicGen的运算效率和生成速度都比同类型AI模型更为出色。”
  除此之外,MusicGen还支持文本与旋律的组合输入,例如你可以提出生成“一首轻快的曲目”并同时要求“将它与贝多芬的《欢乐颂》结合起来”。
  研发团队还对MusicGen的实际表现进行了测试。结果显示,与谷歌的MusicLM以及Riffusion、Mousai、Noise2Music等其他音乐模型相比,MusicGen在测试音乐与文本提示的匹配度以及作曲的可信度等指标上表现更好,总体而言略高于谷歌MusicLM的水平。
  me ta已允许该模型的商业使用,并在Huggingface上发布了一个供演示用的网页 应用
声明:凡开云电子链接 来源注明为其他媒体来源的信息,均为转载自其他媒体,并不代表本网站赞同其观点,也不代表本网站对其真实性负责。您若对该文章内容有任何疑问或质疑,请立即与开云客户(www.www.wykobounce.com)联系,本网站将迅速给您回应并做处理。
电话:021-39553798-8007
更多> 相关开云电子链接
0 相关评论

推荐图文
推荐开云电子链接
点击排行
Baidu
map