通义深度研究：开源AI研究新范式

Update: 2025-09-21

Description

阿里巴巴通义实验室在开发自主信息搜索和推理代理模型方面的进展，集中于三个相关的项目：Tongyi DeepResearch、WebDancer 和 WebSailor。这些研究的核心目标是构建能够执行复杂、多步骤任务的大型语言模型（LLMs），方法包括生成高质量、高不确定性的训练数据，例如通过构建知识图谱和模糊信息来合成问题（SailorFog-QA, CRAWLQA），以及使用如 ReAct 框架和强化学习（RL）等后训练方法。特别是，WebSailor 引入了 DUPO 算法来提高 RL 训练的效率和有效性，而 WebWatcher 则将代理的能力扩展到了多模态（Vision-Language, VL）推理任务，并在 BrowseComp-VL 和 HLE 等挑战性基准测试中展现出超越现有开源和专有系统的性能。

Comments

In Channel

通义深度研究：开源AI研究新范式

2025-09-2124:25

腾讯AI Lab的“角色中心”：十亿虚拟角色如何驱动AI生成数据

2025-09-1921:33

推理加速：RASD 和 REFRAG 深度解析

2025-09-1039:09

美团入局大模型：LongCat-Flash如何高效驱动智能体？深度解析MoE架构、零计算专家与数据飞轮

2025-08-3121:41

深度解析Intern-S1如何颠覆科研AI

2025-08-2425:03

超越自回归：并行文本生成技术如何加速大模型推理

2025-08-1812:23

大语言模型链式思维推理：是假象还是真实能力？

2025-08-0908:38

Seed Diffusion Preview: 来自字节 Seed 团队的高速推理代码语言模型

2025-08-0309:06

Qwen团队：组序列策略优化算法GSPO

2025-07-2607:58

AI 智能体的上下文工程：来自Manus 经验分享

2025-07-2411:15

Google 提出的新模型架构 MoR，Transformer 之外的一条新路径

2025-07-2007:07

vLLM凭什么这么快？揭秘大模型推理的内存与调度黑科技

2025-07-1910:36

ZeroSearch: 激发LLM模型的搜索能力

2025-05-0807:47

00:00

1.0x

#box-pro-ellipsis-176040391890885{-webkit-line-clamp:2;}通义深度研究：开源AI研究新范式

通义深度研究：开源AI研究新范式

通义深度研究：开源AI研究新范式