基础大模型研发转向深度攻坚上海人工智能企业聚焦核心赛道突围

AI产业的泡沫挤压与理性回归 2023年见证了中国AI行业的集体狂欢。

据统计，当年年底全国拥有10亿参数以上的大模型近80个，百亿参数级别的大模型逾10家。

这场"百模大战"一时间声势浩大，各类应用层出不穷，从文案生成到情感陪伴，从供应链优化到各行业赋能，市场呈现出繁荣的表象。

然而繁荣背后隐藏着产业的虚浮。

复旦大学计算机科学技术学院教授邱锡鹏敏锐地观察到，这一时期大模型存在严重的同质化问题。

名字各异、功能标签不同的众多大模型，背后却是相同的技术逻辑，本质上"一张脸"。

更令人担忧的是，大量资本和人才涌入大模型赛道，导致自然语言处理等基础研究领域反而在萎缩。

邱锡鹏回顾，2015年前该领域还有对话、问答、机器翻译等多个研究方向，学者之间互相启发、各展所长，而当整个行业一窝蜂涌向语言模型时，更多的学术可能性被扼杀了。

两年多的时间足以见证产业的洗牌。

业内人士透露，目前仍在坚持基础大模型研究的企业已不足10家。

这个数字的急剧下降，反映了市场的冷静与行业的重新定位。

那些曾经跟风而来的企业已逐渐退场或转向，只有真正掌握核心技术、对产业发展有深刻理解的企业才能坚守下来。

技术规律决定战略选择为什么上海的AI企业还要"死磕"基础大模型？

答案在于对技术发展规律的认识。

成立不到三年的阶跃星辰已累计发布22款基座模型，其中包括具备强大视觉感知和复杂推理能力的新一代基础大模型Step 3。

该企业副总裁李璟的表述简洁有力："基础大模型的能力决定了应用的上限。

"这不是一句口号，而是基于技术发展现状的理性判断。

当前大模型技术尚未收敛，技术路线仍在演进，底层能力仍有提升空间。

在这个阶段，如果企业过早将资源压注于应用开发，一旦底层技术发生根本性变革，之前的应用研发投入将迅速被新技术所取代，成为沉没成本。

这种选择体现在商汤科技的组织调整中。

作为成立第十年、正值生成式AI成为产业主线的时刻，商汤于2024年底启动了业务与组织架构分拆，推出"1+X"战略。

其中"1"是指生成式AI与视觉AI双引擎的核心业务，"X"则是包括智能驾驶、家庭机器人、智慧医疗、智慧零售等应用业务。

这一调整并非技术路线的试探，而是在完成AI代际转换后，对核心能力与资源配置的再次聚焦。

对商汤而言，生成式AI已从单纯的技术突破升级为驱动公司未来增长的核心业务。

国际竞争映照坚守的价值国际舞台上的案例强化了这一判断。

2025年11月，谷歌发布新一代人工智能模型Gemini 3，在LMArena排行榜上以1501分稳居第一，在数学能力测试中以23.4%的得分率远超竞争对手，而OpenAI的GPT-5.1等模型得分率仅在1%左右。

这被视作谷歌在AI领域的"绝地反击"，也是其对基础大模型持续投入的回报。

谷歌的逆风翻盘故事值得深思。

在2022年底ChatGPT引爆生成式AI浪潮后，曾被业内公认为AI"优等生"的谷歌一度陷入被动，产品迭代节奏滞后，市场信心动摇。

但谷歌没有跟风OpenAI的"模仿学习到强化学习"路线，而是继续坚持自己的"理解生成一体化"路线。

这种坚守源于谷歌对大模型本质的理解——它应是提升效率的超级工具，而非情感伴侣。

正是这种战略定力，使谷歌在长期竞争中逐渐获得优势，Gemini 3在应用市场表现强劲，截至2024年11月其全球月活跃用户同比增长170%。

热潮可以造势，沉潜才能成事。

大模型从“竞速赛”走向“耐力赛”，比拼的不仅是发布频率与市场声量，更是底层创新的厚度与长期投入的定力。

当应用落地进入“比质量、比成本、比可信”的新阶段，谁能在基础能力上把短板补齐、把长板做长，谁就更可能在下一轮技术拐点到来时掌握主动权。

上海企业继续深耕基础大模型“深水区”，既是对产业周期的理性判断，也为我国在新一轮科技竞争中积蓄更坚实的底座。

基础大模型研发转向深度攻坚 上海人工智能企业聚焦核心赛道突围