【区角快讯】据海外媒体3月1日报道,国产大模型企业DeepSeek计划于下周正式推出其多模态大语言模型V4版本。该模型将原生支持图像、视频与文本的生成能力,是继今年1月发布R1推理模型后,DeepSeek首次进行的重大版本升级,有望进一步满足国内市场对低成本开源模型的迫切需求。

值得注意的是,此次V4在测试阶段采取了非同寻常的策略。消息人士称,DeepSeek已向华为等中国本土硬件厂商开放了模型的早期访问权限。然而,与行业惯例相悖的是,该公司并未向全球主流GPU供应商英伟达和AMD提供预发布版本的测试资格。
长期以来,人工智能开发者普遍会在模型正式发布前,与领先的芯片制造商共享测试版本,以确保软件在主流硬件平台上的兼容性与运行效率。此前,DeepSeek也曾与英伟达技术团队保持密切协作。此番转向,标志着其生态合作策略出现明显调整。
通过这一差异化授权安排,以华为为代表的国产芯片企业获得了数周的先发窗口期。在此期间,它们可针对自研处理器开展深度软件优化,从而在模型部署效率与系统协同性能方面抢占优势。分析指出,此举不仅为本土芯片争取了关键的技术迭代时间,也体现了国产大模型厂商推动软硬件一体化协同发展的新动向。
在全球AI基础设施竞争加剧的背景下,DeepSeek的选择或预示着中国大模型产业正从“通用适配”迈向“自主可控”的新阶段。