Tempolor 2.0 - 技术研究

MAR 架构 · 2024.9

Tempolor 2.0

基于掩码式自回归生成模型（MAR）与连续音乐音频声学表征，44.1kHz 双声道，强化歌曲级结构建模能力，段落衔接与主题复现更加自然。

44.1kHz 双声道

MAR 掩码自回归

歌曲级结构建模

副歌精准回归

概述

Tempolor 2.0 基于掩码式自回归生成模型（MAR）与连续音乐音频声学表征，支持生成 44.1kHz、双声道高品质音乐音频。

相较于 Tempolor 1.0， 2.0在音质表现之外，进一步强化歌曲级别的结构建模能力，更注重曲式组织、段落衔接与前后呼应，使生成结果在旋律发展、情绪递进和主题呈现上更加自然，更符合真实的作创习惯。

模型表现

Tempolor 2.0 在长时结构一致性、重复段稳定性与段落变化控制等创作维度上进一步增强。

基于掩码式自回归建模范式（MAR），模型能够显式建模全局上下文依赖，精准捕捉段落之间的结构关联，使音乐衔接更自然、发展更连贯，并有效降低前后语义漂移。

Tempolor 2.0 在桥段过渡、主题动机、副歌重复等关键音乐组织能力上，相较于Tempolor 1.0 显著提升，可生成结构完整、段落呼应清晰、整体一致性更强的歌曲作品。

Demo

Soaring in Moonlight

0:00 / 0:00

POPNew Soul

心灵的契合

0:00 / 0:00

POPNew Soul