国内科研团队推出高效开源智能体模型 4B参数达到30B级性能

随着智能体技术成为大模型应用的重要方向,如何算力、成本与性能之间取得平衡成为行业关注焦点。为满足"端侧可用、长程可控、任务可扩展"的需求,面壁智能联合清华大学自然语言处理实验室、中国人民大学及OpenBMB开源社区,正式开源智能体模型AgentCPM-Explore。该模型仅需约4B参数,即可实现长程任务在终端设备上的高效部署。 当前智能体应用面临的主要挑战在于:任务通常涉及多步骤推理、工具调用和网页检索等复杂流程,对模型的规划能力和系统执行能力要求较高。虽然云端大模型性能优越,但在移动设备、嵌入式系统等场景下,成本、时延和隐私问题限制了其应用范围。这使得"小模型实现大能力"的技术路径愈发重要。 AgentCPM-Explore通过优化训练范式与系统工程,在多项基准测试中显示出优异的参数效能比。在GAIA、HLE、Browsercomp等测试中,其表现不仅领先同规模模型,部分指标甚至超越更大规模的模型。特别是在Xbench-DeepResearch评测中,其表现优于多个闭源模型,显示出更强的能力密度。 该模型可能带来三上影响:首先,降低企业和开发者尝试智能体应用的门槛,便于在客服、办公助手等场景快速验证;其次,推动端云协同的合理分工,发挥端侧隐私保护和响应速度优势;第三,通过全流程代码开源,促进科研可复现性,如在GAIA评测中实现了从25.24%到63.90%的性能提升。 要实现小模型智能体的规模化应用,仍需解决以下问题:建立更贴近实际业务的评测体系;完善端侧部署的工程标准;规范数据与流程治理;加强产学研协作。随着终端算力提升和隐私需求增强,端侧智能体有望成为新的增长点。4B级模型若能在长程任务中保持稳定性能,将推动"轻量模型+工具链+任务编排"生态的快速发展。

AgentCPM-Explore的开源是我国智能体技术发展的重要里程碑。此成果展现了国内产学研协同创新的实力,为AI技术的普惠应用提供了新可能。随着高效能模型的优化和应用场景拓展,智能技术将更好地服务于经济社会发展。