deepseekv4lite 秘密测试

DeepSeek V4的推出日期就在下周,这款全新多模态模型会给大家带来不少惊喜。官方透露,它可以让图片、视频和文本生成结合起来,能做不少有趣的事。DeepSeek还专门给国产芯片做了适配,这次算是把算力支持做到位了,期待能带动一下中国市场对半导体的需求。据知情人士说,发布V4的时候可能会发个技术说明,一个月后还有个更详细的报告。不过到目前为止,官方还没给任何信息回应,所有消息都是媒体爆料的。 DeepSeekV4Lite正在秘密测试呢,它的代号是“sealion-lite”,上下文窗口已经达到了100万个token,比V3系列提升了近8倍。要是这样算的话,一次处理完《三体》全集这种长篇小说应该没问题。这个版本是原生多模态架构,也就是模型在预训练的时候就把文本和视觉理解融合在一起了。参数规模估计有2000亿左右,有人猜测完整版V4的参数量可能超过1万亿。 关于效果嘛,网页端或者APP端的模型在它面前可能就有点逊色了。根据泄露的测试例子显示,V4Lite只用54行代码就能生成高质量的SVG图像了,比如Xbox手柄这种东西。代码优化和视觉还原度方面确实做得不错,比DeepSeekV3.2和ClaudeOpus4.6都要强。 这些信息也暗示了它的空间推理和结构化输出能力有了不小的提升。希望大家期待下这款AI产品的表现吧。