模型总览
MAR 架构 · 2024.9
Tempolor 2.0
基于掩码式自回归生成模型(MAR)与连续音乐音频声学表征,44.1kHz 双声道,强化歌曲级结构建模能力,段落衔接与主题复现更加自然。
44.1kHz 双声道
MAR 掩码自回归
歌曲级结构建模
副歌精准回归
概述

Tempolor 2.0 基于掩码式自回归生成模型(MAR)与连续音乐音频声学表征,支持生成 44.1kHz、双声道高品质音乐音频。

相较于 Tempolor 1.0, 2.0在音质表现之外,进一步强化歌曲级别的结构建模能力,更注重曲式组织、段落衔接与前后呼应,使生成结果在旋律发展、情绪递进和主题呈现上更加自然,更符合真实的作创习惯。

模型表现

Tempolor 2.0 在长时结构一致性、重复段稳定性与段落变化控制等创作维度上进一步增强。

基于掩码式自回归建模范式(MAR),模型能够显式建模全局上下文依赖,精准捕捉段落之间的结构关联,使音乐衔接更自然、发展更连贯,并有效降低前后语义漂移。

Tempolor 2.0 在桥段过渡、主题动机、副歌重复等关键音乐组织能力上,相较于Tempolor 1.0 显著提升,可生成结构完整、段落呼应清晰、整体一致性更强的歌曲作品。

Demo
Soaring in Moonlight
0:00 / 0:00
POPNew Soul
心灵的契合
0:00 / 0:00
POPNew Soul