DiscoverDaily LLM Papers通义深度研究:开源AI研究新范式
通义深度研究:开源AI研究新范式

通义深度研究:开源AI研究新范式

Update: 2025-09-21
Share

Description

通义 DeepResearch:开源 AI 智能体的新纪元

阿里巴巴通义实验室在开发自主信息搜索和推理代理模型方面的进展,集中于三个相关的项目:Tongyi DeepResearchWebDancerWebSailor。这些研究的核心目标是构建能够执行复杂、多步骤任务的大型语言模型(LLMs),方法包括生成高质量、高不确定性的训练数据,例如通过构建知识图谱和模糊信息来合成问题(SailorFog-QA, CRAWLQA),以及使用如 ReAct 框架强化学习(RL)等后训练方法。特别是,WebSailor 引入了 DUPO 算法来提高 RL 训练的效率和有效性,而 WebWatcher 则将代理的能力扩展到了多模态(Vision-Language, VL)推理任务,并在 BrowseComp-VL 和 HLE 等挑战性基准测试中展现出超越现有开源和专有系统的性能。

Comments 
loading
00:00
00:00
1.0x

0.5x

0.8x

1.0x

1.25x

1.5x

2.0x

3.0x

Sleep Timer

Off

End of Episode

5 Minutes

10 Minutes

15 Minutes

30 Minutes

45 Minutes

60 Minutes

120 Minutes

通义深度研究:开源AI研究新范式

通义深度研究:开源AI研究新范式