为什么没人质疑小米这次新发布的ai大模型呢？

为什么没人质疑小米这次新发布的AI大模型呢？简单说，是因为压根找不到什么可吐槽的地方，他们要么看不懂，要么就觉得超过了自己的理解范围。这次搞的技术确实挺高深，内行才知道门路。就算是那些汽车或手机厂商想跟你硬刚，你一掏出数据说话，对方基本就懵了。你再看看这个事儿有多麻烦，根本不是想拦着就能拦得住的。毕竟这东西是全世界的人都能去测试的，不管是国内还是国际上的玩家都想去测一测，看看小米排多少名。你要是说不让国内发排名，那没用，国际上还有个排名呢。这个模型到底有多强？全球排第八，国内排第二。要知道第一是谷歌的那种万亿参数模型。要是拿迪普斯来比，它这参数量相当于满血版的7000亿。说白了这就是agent（智能体）的基座系统。就好比人家那个是安卓原生系统，咱们小米自己开发的澎湃OS是基于它改的。想做就得有人、有时间、有钱。光训练数据这一关就非常复杂，你得去采集数据、买数据，买回来还得清洗、合规审查、去重处理。你看人家现在有多少万张A100的显卡做算力集群呢？光一张H100的卡就得十几二十万。就算你没卡也得租呀。训练完了预训练还没完呢，后面还有监督训练和强化训练呢。这个项目投入周期很长，没有一两年根本搞不出来。不光是算力问题，最关键的是人才！你有足够多的AI科学家、产品架构师、算法架构师、数据工程团队还有合规评估团队吗？你得让这些专家认可才行啊。至于大家都在讨论的MOE架构和Transformer架构，那些黑子压根不懂这些词儿。你给他讲参数他也不明白，什么叫7B、什么叫1万亿参数？每个参数具体是什么意思？甚至连TOKEN都不知道是啥玩意？他们完全不明白为什么要分TOKEN，也不晓得训练和强化学习是怎么调出来的。什么损失函数、反向传播这些词儿对他们来说太专业了。所以啊，这就没法黑喽。