国内科研团队推出高效开源智能体模型 4B参数达到30B级性能

随着智能体技术成为大模型应用的重要方向，如何算力、成本与性能之间取得平衡成为行业关注焦点。为满足"端侧可用、长程可控、任务可扩展"的需求，面壁智能联合清华大学自然语言处理实验室、中国人民大学及OpenBMB开源社区，正式开源智能体模型AgentCPM-Explore。该模型仅需约4B参数，即可实现长程任务在终端设备上的高效部署。当前智能体应用面临的主要挑战在于：任务通常涉及多步骤推理、工具调用和网页检索等复杂流程，对模型的规划能力和系统执行能力要求较高。虽然云端大模型性能优越，但在移动设备、嵌入式系统等场景下，成本、时延和隐私问题限制了其应用范围。这使得"小模型实现大能力"的技术路径愈发重要。 AgentCPM-Explore通过优化训练范式与系统工程，在多项基准测试中显示出优异的参数效能比。在GAIA、HLE、Browsercomp等测试中，其表现不仅领先同规模模型，部分指标甚至超越更大规模的模型。特别是在Xbench-DeepResearch评测中，其表现优于多个闭源模型，显示出更强的能力密度。该模型可能带来三上影响：首先，降低企业和开发者尝试智能体应用的门槛，便于在客服、办公助手等场景快速验证；其次，推动端云协同的合理分工，发挥端侧隐私保护和响应速度优势；第三，通过全流程代码开源，促进科研可复现性，如在GAIA评测中实现了从25.24%到63.90%的性能提升。要实现小模型智能体的规模化应用，仍需解决以下问题：建立更贴近实际业务的评测体系；完善端侧部署的工程标准；规范数据与流程治理；加强产学研协作。随着终端算力提升和隐私需求增强，端侧智能体有望成为新的增长点。4B级模型若能在长程任务中保持稳定性能，将推动"轻量模型+工具链+任务编排"生态的快速发展。

AgentCPM-Explore的开源是我国智能体技术发展的重要里程碑。此成果展现了国内产学研协同创新的实力，为AI技术的普惠应用提供了新可能。随着高效能模型的优化和应用场景拓展，智能技术将更好地服务于经济社会发展。