特斯拉ceo马斯克:把中国ai 底层技术给突破了

快科技3月19日的消息,咱们聊聊3月16日特斯拉CEO马斯克是怎么表扬Kimi团队的,而且把他们的工作推到公众面前。这次论文发布之后,好多人都在关注作者名单里面的Guangyu Chen,也就是陈广宇,这个17岁的高中生从广东深圳来,把中国AI底层技术给突破了。原来他跟张宇和苏剑林三个人是共同第一作者,其他34位参与人都没有这个资格。张宇负责Kimi模型架构,苏剑林发明了RoPE技术。更厉害的是,陈广宇进入AI领域才一年时间。他就是靠自己读书和GitHub上面的项目把基础知识和实践能力都补齐了。去年暑假他还跑到旧金山实习了7周,回来之后就加入Kimi团队了。 这次技术报告提出了Attention Residuals机制,这是对Transformer残差连接的一次大改革。Kimi团队的创新把注意力机制转移到了模型深度维度上面,让每一层都能动态筛选有用信息并且降低冗余信息。 论文发出来之后,陈广宇在朋友圈里提到这三个共同作者和负责基础设施搭建的同事。他说这是团队成果,不要造神。 马斯克说这项工作令人印象深刻,并且表示会继续关注中国AI企业的发展。