上海交大发布光学垂直大模型Optics GPT 以专业化训练推动“智赋光学”落地提速

当前,通用人工智能模型虽已具备较强能力,但光学、材料等高度依赖专业知识与精密计算的硬科技领域仍有明显短板。由于这类领域知识体系复杂、专业门槛高,通用模型难以建立准确的物理直觉和工程理解,导致在实际应用中专业深度与可靠性不足。该矛盾已成为硬科技产业智能化升级的重要瓶颈。为破解这一难题,上海交通大学“光生未来”项目组经过系统研发,推出Optics GPT光学垂直大模型。不同于对通用模型的简单改造,Optics GPT基于光学专业数据训练而成,系统学习了光通信、光学设计等方向的核心知识与设计逻辑,形成扎实的“光学素养”。通俗来说,通用大模型更像“知识面广的通才”,而Optics GPT是“深耕领域的专才”,通过聚焦特定领域的系统学习,在光学问题上提供更贴近工程实践、更具体、更可信的解决方案。为客观评估模型能力,研发团队构建了覆盖光物理、光量子、光学设计、非线性光学、光计算与光通信六大方向的专业评测集,并与多款主流通用大模型及开源大模型开展对比测试。结果显示,Optics GPT在核心指标上整体领先,验证了其在光学垂直领域的专业深度与工程认知能力。该成果也验证了一条可行路径:通过专业化、结构化训练,参数规模相对较小的模型同样有机会在垂直领域超越大型通用模型,为硬科技智能化提供新的实现方式。Optics GPT具备四项核心技术特点:其一是易部署,模型规模为8B参数量级,支持端侧与边缘高效部署,降低行业落地门槛;其二是高认知,通过系统化、结构化注入光学知识,形成更准确的物理直觉;其三是强应用,在算法生成、系统诊断、仿真设计、实验辅助等关键场景中表现突出;其四是可控性强,从数据构建、模型训练到部署运行实现全流程自主可控,兼顾产业安全与数据隐私。上述特性使其成为面向光学领域的国产自研垂直模型,并具备明确的应用价值。在应用前景上,Optics GPT将服务教学、科研与产业三大场景。在教育教学中,模型可将抽象理论与复杂公式转化为更直观的可视化演示与互动问答,自动生成教学案例与虚拟实验,缓解设备与场地限制,为光学人才培养提供支撑。在科学研究中,模型可作为全天候研究助手,帮助快速梳理文献、启发研究思路、完成复杂模拟计算并辅助设计实验方案,加快从理论到验证的节奏。在工业设计领域,以国产高端仪器为例,模型可提升仪器使用体验与智能化水平,推动光学产业在设计研发、生产制造与运维服务等环节的智能化升级。

此次突破不仅补齐了我国光学垂直大模型上的能力空缺,也为硬科技领域探索出一条可复制的专业化创新路径;随着更多垂直领域模型的推出,“AI+专业”的深度融合有望为科技自立自强注入新动能。实践表明,围绕真实需求推进专业化发展,将成为我国在新一轮科技竞争中提升优势的重要方向。