AI产业的泡沫挤压与理性回归 2023年见证了中国AI行业的集体狂欢。
据统计,当年年底全国拥有10亿参数以上的大模型近80个,百亿参数级别的大模型逾10家。
这场"百模大战"一时间声势浩大,各类应用层出不穷,从文案生成到情感陪伴,从供应链优化到各行业赋能,市场呈现出繁荣的表象。
然而繁荣背后隐藏着产业的虚浮。
复旦大学计算机科学技术学院教授邱锡鹏敏锐地观察到,这一时期大模型存在严重的同质化问题。
名字各异、功能标签不同的众多大模型,背后却是相同的技术逻辑,本质上"一张脸"。
更令人担忧的是,大量资本和人才涌入大模型赛道,导致自然语言处理等基础研究领域反而在萎缩。
邱锡鹏回顾,2015年前该领域还有对话、问答、机器翻译等多个研究方向,学者之间互相启发、各展所长,而当整个行业一窝蜂涌向语言模型时,更多的学术可能性被扼杀了。
两年多的时间足以见证产业的洗牌。
业内人士透露,目前仍在坚持基础大模型研究的企业已不足10家。
这个数字的急剧下降,反映了市场的冷静与行业的重新定位。
那些曾经跟风而来的企业已逐渐退场或转向,只有真正掌握核心技术、对产业发展有深刻理解的企业才能坚守下来。
技术规律决定战略选择 为什么上海的AI企业还要"死磕"基础大模型?
答案在于对技术发展规律的认识。
成立不到三年的阶跃星辰已累计发布22款基座模型,其中包括具备强大视觉感知和复杂推理能力的新一代基础大模型Step 3。
该企业副总裁李璟的表述简洁有力:"基础大模型的能力决定了应用的上限。
"这不是一句口号,而是基于技术发展现状的理性判断。
当前大模型技术尚未收敛,技术路线仍在演进,底层能力仍有提升空间。
在这个阶段,如果企业过早将资源压注于应用开发,一旦底层技术发生根本性变革,之前的应用研发投入将迅速被新技术所取代,成为沉没成本。
这种选择体现在商汤科技的组织调整中。
作为成立第十年、正值生成式AI成为产业主线的时刻,商汤于2024年底启动了业务与组织架构分拆,推出"1+X"战略。
其中"1"是指生成式AI与视觉AI双引擎的核心业务,"X"则是包括智能驾驶、家庭机器人、智慧医疗、智慧零售等应用业务。
这一调整并非技术路线的试探,而是在完成AI代际转换后,对核心能力与资源配置的再次聚焦。
对商汤而言,生成式AI已从单纯的技术突破升级为驱动公司未来增长的核心业务。
国际竞争映照坚守的价值 国际舞台上的案例强化了这一判断。
2025年11月,谷歌发布新一代人工智能模型Gemini 3,在LMArena排行榜上以1501分稳居第一,在数学能力测试中以23.4%的得分率远超竞争对手,而OpenAI的GPT-5.1等模型得分率仅在1%左右。
这被视作谷歌在AI领域的"绝地反击",也是其对基础大模型持续投入的回报。
谷歌的逆风翻盘故事值得深思。
在2022年底ChatGPT引爆生成式AI浪潮后,曾被业内公认为AI"优等生"的谷歌一度陷入被动,产品迭代节奏滞后,市场信心动摇。
但谷歌没有跟风OpenAI的"模仿学习到强化学习"路线,而是继续坚持自己的"理解生成一体化"路线。
这种坚守源于谷歌对大模型本质的理解——它应是提升效率的超级工具,而非情感伴侣。
正是这种战略定力,使谷歌在长期竞争中逐渐获得优势,Gemini 3在应用市场表现强劲,截至2024年11月其全球月活跃用户同比增长170%。
热潮可以造势,沉潜才能成事。
大模型从“竞速赛”走向“耐力赛”,比拼的不仅是发布频率与市场声量,更是底层创新的厚度与长期投入的定力。
当应用落地进入“比质量、比成本、比可信”的新阶段,谁能在基础能力上把短板补齐、把长板做长,谁就更可能在下一轮技术拐点到来时掌握主动权。
上海企业继续深耕基础大模型“深水区”,既是对产业周期的理性判断,也为我国在新一轮科技竞争中积蓄更坚实的底座。