Google 提出的新模型架构 MoR，Transformer 之外的一条新路径

Update: 2025-07-20

Description

Mixture-of-Recursions: Learning Dynamic Recursive Depths for Adaptive Token-Level Computation

这篇研究论文介绍了Mixture-of-Recursions (MoR)，这是一个针对大型语言模型（LLMs）效率的新框架。MoR通过参数共享（重复使用一套共享层）和自适应计算（轻量级路由器动态分配不同递归深度给单个令牌）来降低计算和内存成本。该研究探讨了两种主要的路由策略——专家选择和令牌选择——以及两种键值（KV）缓存策略，以优化性能。实验结果表明，MoR在相同的计算预算下，显著提升了LLMs的验证困惑度和少量样本准确性，并实现了更高的推理吞吐量，证明其在降低大型模型成本方面是有效的。

论文原文：https://www.alphaxiv.org/abs/2507.10524

Comments

In Channel

通义深度研究：开源AI研究新范式

2025-09-2124:25

腾讯AI Lab的“角色中心”：十亿虚拟角色如何驱动AI生成数据

2025-09-1921:33

推理加速：RASD 和 REFRAG 深度解析

2025-09-1039:09

美团入局大模型：LongCat-Flash如何高效驱动智能体？深度解析MoE架构、零计算专家与数据飞轮

2025-08-3121:41

深度解析Intern-S1如何颠覆科研AI

2025-08-2425:03

超越自回归：并行文本生成技术如何加速大模型推理

2025-08-1812:23

大语言模型链式思维推理：是假象还是真实能力？

2025-08-0908:38

Seed Diffusion Preview: 来自字节 Seed 团队的高速推理代码语言模型

2025-08-0309:06

Qwen团队：组序列策略优化算法GSPO

2025-07-2607:58

AI 智能体的上下文工程：来自Manus 经验分享

2025-07-2411:15

Google 提出的新模型架构 MoR，Transformer 之外的一条新路径

2025-07-2007:07

vLLM凭什么这么快？揭秘大模型推理的内存与调度黑科技

2025-07-1910:36

ZeroSearch: 激发LLM模型的搜索能力

2025-05-0807:47

00:00

1.0x

Google 提出的新模型架构 MoR，Transformer 之外的一条新路径

#box-pro-ellipsis-176041936090232{-webkit-line-clamp:2;}Google 提出的新模型架构 MoR，Transformer 之外的一条新路径

Google 提出的新模型架构 MoR，Transformer 之外的一条新路径

Google 提出的新模型架构 MoR，Transformer 之外的一条新路径