TL;DR
本文深度梳理了离散扩散语言模型(MDLM)的发展脉络。从 SEMDLM 的理论奠基,到 LLaDA 实现 100B 参数的 Scaling 验证,再到 2026 年初关于 DLM 十大挑战的宏观思考。文章重点剖析了 DLM 与自回归模型(ARM)的差异,介绍了 “DLM 规划 + ARM 执行” 等多种前沿混合架构,并探讨了 RL 后训练中的“灵活性陷阱”。核心观点认为:DLM 的真正潜力不在于并行推理,而在于其非线性推理、全局编辑与迭代修正的认知模式。
本来正打算写(学)一写(学) DLM 的,都看了一阵子了,突然刷到这么一篇论文:2601 Top 10 Open Challenges Steering the Future of Diffusion Language Model and Its Variants[1],这是篇好论文呀。于是,就趁着这股东风,把一些观点一并梳理下。本文内容相对侧重观点介绍和梳理而非公式推导。另外,本文涉及的 DLM 并不是完整的,大部分时候仅指 MDLM,也就是 Masked Diffusion Language Models。