打造一个有温度、有趣味、专业的全栈式AI&AIGC交流社区,
用心写好每一篇文章!
HF链接-https://huggingface.co/deepseek-ai/DeepSeek-V3.1-Base/tree/main

01-DeepSeek V3.1简介

DeepSeek-V3.1-Base有如下4个关键更新:
这是一个混合模型,具有可切换的思维模式,这种模式已经被Qwen所抛弃,或许DeepSeek找到了更好的解决方案?
添加了对搜索令牌的原生支持,这意味着更好的搜索功能。我特别检查了一下,R1没有这个令牌,所以它可能是一个新启用的用于原生搜索支持的令牌,而不是用于统一V3和R1的词汇表。社区报告称,除非明确提示不搜索,否则搜索触发率特别高。
编程能力可能特别强。根据Aider从社区测试的数据,它直接在开放权重模型中排名第一。
上下文长度没有改变;旧的DeepSeek-V3-Base也有128K。
02-DeepSeek V3.1关键信息



这是网友提供的一份与当前的一些主流模型的跑分结果,我们可以观察到:与其它模型相比,该模型的给选哪个指标在DeepSeek V3-0324版本的基础上有一定的提升,使用成本更低、平均耗时更低!
03-DeepSeek V3.1效果展示

04-DeepSeek V3.1总结

关注我,AI热点早知道,AI算法早精通,AI产品早上线!

禁止私自转载,需要转载请先征求我的同意!
欢迎你的加入,让我们一起交流、讨论与成长!