deepseekv4lite 秘密测试

DeepSeek V4的推出日期就在下周，这款全新多模态模型会给大家带来不少惊喜。官方透露，它可以让图片、视频和文本生成结合起来，能做不少有趣的事。DeepSeek还专门给国产芯片做了适配，这次算是把算力支持做到位了，期待能带动一下中国市场对半导体的需求。据知情人士说，发布V4的时候可能会发个技术说明，一个月后还有个更详细的报告。不过到目前为止，官方还没给任何信息回应，所有消息都是媒体爆料的。 DeepSeekV4Lite正在秘密测试呢，它的代号是“sealion-lite”，上下文窗口已经达到了100万个token，比V3系列提升了近8倍。要是这样算的话，一次处理完《三体》全集这种长篇小说应该没问题。这个版本是原生多模态架构，也就是模型在预训练的时候就把文本和视觉理解融合在一起了。参数规模估计有2000亿左右，有人猜测完整版V4的参数量可能超过1万亿。关于效果嘛，网页端或者APP端的模型在它面前可能就有点逊色了。根据泄露的测试例子显示，V4Lite只用54行代码就能生成高质量的SVG图像了，比如Xbox手柄这种东西。代码优化和视觉还原度方面确实做得不错，比DeepSeekV3.2和ClaudeOpus4.6都要强。这些信息也暗示了它的空间推理和结构化输出能力有了不小的提升。希望大家期待下这款AI产品的表现吧。