为什么没人质疑小米这次新发布的AI大模型呢?简单说,是因为压根找不到什么可吐槽的地方,他们要么看不懂,要么就觉得超过了自己的理解范围。这次搞的技术确实挺高深,内行才知道门路。就算是那些汽车或手机厂商想跟你硬刚,你一掏出数据说话,对方基本就懵了。你再看看这个事儿有多麻烦,根本不是想拦着就能拦得住的。毕竟这东西是全世界的人都能去测试的,不管是国内还是国际上的玩家都想去测一测,看看小米排多少名。你要是说不让国内发排名,那没用,国际上还有个排名呢。这个模型到底有多强?全球排第八,国内排第二。要知道第一是谷歌的那种万亿参数模型。要是拿迪普斯来比,它这参数量相当于满血版的7000亿。说白了这就是agent(智能体)的基座系统。 就好比人家那个是安卓原生系统,咱们小米自己开发的澎湃OS是基于它改的。想做就得有人、有时间、有钱。光训练数据这一关就非常复杂,你得去采集数据、买数据,买回来还得清洗、合规审查、去重处理。你看人家现在有多少万张A100的显卡做算力集群呢?光一张H100的卡就得十几二十万。就算你没卡也得租呀。训练完了预训练还没完呢,后面还有监督训练和强化训练呢。 这个项目投入周期很长,没有一两年根本搞不出来。不光是算力问题,最关键的是人才!你有足够多的AI科学家、产品架构师、算法架构师、数据工程团队还有合规评估团队吗?你得让这些专家认可才行啊。 至于大家都在讨论的MOE架构和Transformer架构,那些黑子压根不懂这些词儿。你给他讲参数他也不明白,什么叫7B、什么叫1万亿参数?每个参数具体是什么意思?甚至连TOKEN都不知道是啥玩意?他们完全不明白为什么要分TOKEN,也不晓得训练和强化学习是怎么调出来的。什么损失函数、反向传播这些词儿对他们来说太专业了。所以啊,这就没法黑喽。