NotaGen经典下载

NotaGen经典下载

文章来源:智汇AI    发布时间:2025-06-11

NotaGen是由中央音乐学院、北京航空航天大学和清华大学等机构联合开发的一款AI音乐生成模型,专注于生成高质量的古典乐谱。

访问官网

NotaGen是什么?

NotaGen是由中央音乐学院、北京航空航天大学和清华大学等机构联合开发的一款AI音乐生成模型,专注于生成高质量的古典乐谱。它通过模仿大型语言模型(LLM)的训练范式,能够生成高质量的古典乐谱。

NotaGen核心特点

高质量古典乐谱生成

NotaGen能够根据用户指定的时期(如巴洛克、古典、浪漫)、作曲家(如巴赫、莫扎特、肖邦)和乐器(如键盘、弦乐四重奏、管弦乐)生成符合特定风格的乐谱。

先进的训练范式

预训练:在超过160万首乐曲上进行预训练,学习音乐的基本结构和模式。

微调:基于约9000首高质量古典作品进行微调,增强对特定风格和作曲家的理解。

强化学习:通过CLaMP-DPO方法优化生成音乐的质量和可控性,无需人工标注或预定义奖励。

多模态数据表示

NotaGen使用交错的ABC符号表示法(InterleavedABCNotation),将不同声部的音符重新排列到一行中,并通过声部指示符[V:]区分。这种表示法能够灵活处理多轨音乐和复杂乐谱。

模型架构

NotaGen采用Tunesformer架构,包含两个层次的GPT-2解码器:patch-leveldecoder和character-leveldecoder。通过patch-leveldecoder捕获patch之间的时间关系,然后将隐藏状态传递给character-leveldecoder,自回归地预测下一个patch的字符。

生成样本

NotaGen提供了多种风格的生成样本,包括键盘、室内乐、管弦乐、艺术歌曲、合唱和声乐管弦乐等。此外,还尝试了流行音乐风格的生成。

NotaGen技术

数据表示:

采用交错的ABC符号表示法,支持多轨音乐和复杂乐谱。

模型架构:

基于Tunesformer,包含patch-level和character-level解码器。

训练范式:

预训练:在160万首乐曲上进行预训练。

微调:在9000首高质量古典乐谱上进行微调,涵盖152位作曲家。

强化学习:通过CLaMP-DPO方法优化生成音乐的质量和可控性。

NotaGen实验与评估

主观A/B测试:

NotaGen在生成音乐的质量上优于基线模型,接近人类作曲水平。

CLaMP-DPO方法:

通过对比学习模型CLaMP²提供的反馈,优化生成音乐的质量,无需人工标注或预定义奖励。

NotaGen使用场景

专业作曲家:

作为灵感工具,快速生成高质量乐谱。

音乐爱好者:

降低音乐创作门槛,提供个性化创作支持。

音乐教育:

作为教学工具,帮助学生理解不同风格和时期的音乐特点。

项目主页:

https://electricalexis.github.io/notagen-demo

GitHub仓库:

https://github.com/ElectricAlexis/NotaGen

论文:

https://arxiv.org/pdf/2502.18008

相关推荐