Meta 开源 AI 语言模型 MusicGen，可将文本和旋律转化为完整乐曲

日期：2023-06-13 来源：IT之家评论：0

标签： AI 科技创新

　　me ta近日在Github上开源了其AI语言模型MusicGen，该模型基于谷歌2017年推出的Transformer模型。如同模型名称所示，MusicGen主要用于音乐生成，它可以将文本和已有的旋律转化为完整乐曲。

　　研发团队表示：“我们使用了20000小时的授权音乐来对训练该模型，并采用me ta的EnCodec编码器将音频数据分解为更小的单元进行并行处理，进而让MusicGen的运算效率和生成速度都比同类型AI模型更为出色。”

　　除此之外，MusicGen还支持文本与旋律的组合输入，例如你可以提出生成“一首轻快的曲目”并同时要求“将它与贝多芬的《欢乐颂》结合起来”。

　　研发团队还对MusicGen的实际表现进行了测试。结果显示，与谷歌的MusicLM以及Riffusion、Mousai、Noise2Music等其他音乐模型相比，MusicGen在测试音乐与文本提示的匹配度以及作曲的可信度等指标上表现更好，总体而言略高于谷歌MusicLM的水平。

　　me ta已允许该模型的商业使用，并在Huggingface上发布了一个供演示用的网页应用。

声明：凡开云电子链接来源注明为其他媒体来源的信息，均为转载自其他媒体，并不代表本网站赞同其观点，也不代表本网站对其真实性负责。您若对该文章内容有任何疑问或质疑，请立即与开云客户(www.www.wykobounce.com)联系，本网站将迅速给您回应并做处理。
电话：021-39553798-8007

更多> 相关开云电子链接

0条 相关评论

推荐图文

加州大学科学家发明了	深圳又一制造业总部基
水下机器人在渔业中的	哈工程水下机器人再夺
里程碑！荆州市首台机	超维科技精彩亮相电力

推荐开云电子链接

点击排行

• OpenAI 对手 Cohere 获 2.7 亿美元融资，欲与其	• 亚马逊利用生成式 AI 总结产品评价，帮助用户筛
• Salesforce 将生成式 AI 创业基金规模提高一倍	• OpenAI CEO 阿尔特曼称中国拥有世界上最优秀的
• 韩国宣布 2025 年起将 AI 引入中小学课程，三年	• 消息称 ChatGPT 未来有望增加更多功能：上传文
• OpenAI CEO 阿尔特曼到访日本，对全球 AI 协调	• 日本学校探索引入 AI 和无人机：提高安保效率，
• 家乐福推出 AI 购物开云电子链接机器人，基于 GPT-4 打	• 中量大学生孵化AI项目打造智能干冰机器人

恰佩克奖	机器人高峰论坛	机气林	ITES深圳工业展	机器人研究院	API数据	库卡机器人
中国传动网	索比光伏网	数控机床市场网	国家标准化委员会