Diffusion LLM:当语言模型不再一个 token 一个 token 写
Mercury 2 在 2026 年 2 月把扩散语言模型推到 1000+ tokens/秒,成为第一个商用产线级的非自回归 LLM。LLaDA 也证明了 8B 扩散模型可以追上 LLaMA3 8B。本文拆解扩散 LLM 的工作原理、它和自回归 LLM 的根本区别、能用在哪、不能用在哪,以及它会不会颠覆 Transformer。
Tag
#AI Research 标签文章合集,收录 Diors.tech 中与 AI Research 相关的 AI 学习笔记、技术拆解和工程实践。
5 篇文章Mercury 2 在 2026 年 2 月把扩散语言模型推到 1000+ tokens/秒,成为第一个商用产线级的非自回归 LLM。LLaDA 也证明了 8B 扩散模型可以追上 LLaMA3 8B。本文拆解扩散 LLM 的工作原理、它和自回归 LLM 的根本区别、能用在哪、不能用在哪,以及它会不会颠覆 Transformer。
MoE、Reasoning Models、SSM、多模态原生——2026 年模型架构与前沿趋势全解析
从文本到视觉、音频、视频,梳理多模态 AI 的技术架构、训练思路、应用场景、产品机会与工程落地挑战。
ReAct、Reflexion、Voyager、CAMEL——Agent 学术研究的关键论文、Benchmark 与未来方向
从 AGI 时间线、基础设施演进、产业变化、社会影响到监管格局,多维度展望 AI 的中长期发展方向。