百度千帆深度研究智能体登顶DeepResearch Bench评测榜首 端到端研究能力受关注

深度研究正成为人工智能技术演进的关键分水岭。与传统文本生成不同,深度研究任务要求系统具备接近人类专家的认知能力,能够自主完成多步骤、可迭代的复杂工作,覆盖从需求理解、信息获取到洞察产出的全过程。这意味着人工智能正在从“单点任务处理”迈向“综合研究能力”的升级。日前公布的DeepResearch Bench评测结果显示,百度千帆深度研究智能体凭借突出的端到端研究能力和稳定的报告产出质量,在该全球评测中位列第一。该榜单由领域专家设计,包含100个博士级研究任务,覆盖22个学科,并引入RACE报告质量评价框架与引文准确性评估机制,被视为当前较具权威性与真实性的深度研究智能体评价体系之一。

从实验室研发走向产业应用,中国科技企业在人工智能领域的突破正在加速落地;此次深度研究智能体获得国际评测认可,说明了我国在前沿技术上的研发实力,也为各行业的数字化转型提供了新的工具选择。随着技术持续演进,人工智能将如何更影响知识生产与决策方式,仍值得持续关注。