客服热线:86-0755-82345012    客服QQ:1926885100 聚焦电子产业链商机匹配! 今日已有105个访客,完成160次访问
关闭
ERP
首页 > 资讯 > DeepSeek新模型发布 百万上下文成标配

DeepSeek新模型发布 百万上下文成标配

时间:2026-04-30 09:19:22 浏览:628

中国人工智能公司DeepSeek(深度求索)24日宣布,其全新系列模型DeepSeek-V4预览版正式上线并同步开源。该模型拥有百万字超长上下文,在 Agent(智能体)能力、世界知识和推理性能上均实现中国国内与开源领域的领先。

按照DeepSeek官方披露信息,V4模型按参数大小分为Pro和Flash两个版本。其中,Pro总参数达1.6万亿,激活参数49B,主要面向尖端任务,性能比肩顶级闭源模型;Flash总参数2840亿,激活参数13B,定位为更快捷高效的经济之选。两者均支持1M(一百万)超长上下文。

“从现在开始,IM上下文将是DeepSeek所有官方服务的标配。”DeepSeek表示,V4采用创新注意力机制,在token维度进行压缩,结合DSA稀疏注意力(DeepSeek Sparse Attention)技术,实现了全球领先的长上下文能力,大幅降低对计算和显存需求。

据介绍,目前V4已成为DeepSeek内部员工使用的Agentic Coding(智能体编程)模型。据测评,其使用体验优于Anthropic的Sonnet 4.5,交付质量接近Opus 4.6的非思考模式,但仍与Opus 4.6思考模式存在一定差距。

API定价方面,DeepSeek继续延续高性价比策略。以每百万tokens计:Flash版输入(缓存命中)是0.2元、输入(缓存未命中)1元、输出2元;Pro版则分别为1元、12元、24元。而官网聊天与App端仍保持免费。

image.png

值得一提的是,DeepSeek在小字中提到,受限于高端算力,目前Pro服务吞吐有限,预计下半年华为升腾950超节点批量上市后,Pro价格会大幅下调。此前在4月初,有报道指出,DeepSeek-V4已首次实现与华为升腾等中国国产芯片的深度适配。

DeepSeek-V4发布后,“华为计算”微信公众号发文表示,升腾一直同步支持DeepSeek系列模型,本次通过双方芯模技术紧密协同,实现升腾超节点全系列产品支持DeepSeek V4系列模型。

升腾950通过融合kernel和多流并行技术降低Attention计算和访存开销,大幅提升推理性能,结合多种量化算法,实现了高吞吐、低时延的DeepSeek V4模型推理部署。升腾A3超节点系列产品也全面适配,同时为便于用户快速微调,提供了基于升腾A3超节点的训练参考实现。

升腾芯片是华为AI算力战略的基础。其发展历程显示,2018年发布首款升腾310芯片,2019年推出升腾910芯片;2025年,升腾910C芯片随Atlas900超节点规模部署,逐渐被外界熟知。去年9月,华为副董事长、轮值董事长徐直军在华为全联接大会2025上首次介绍升腾950系列芯片,官宣升腾950PR将于2026年第一季度推出,首度支持标卡和超节点服务器形态。

另据财联社报道,DeepSeek-4罕见地将华为升腾和英伟达共同写进DeepSeek-V4技术报告:“我们在英伟达GPU和华为升腾NPU平台上验证了细粒度EP(专家并行)方案。”这是DeepSeek官方第一次在正式文档中把华为升腾和英伟达并列写进硬件验证清单。

报告同时披露,V4的MoE专家权重和稀疏注意力索引器都采用FP4精度,FP4(mxFP4)恰好是华为3月发布的升腾950PR芯片的原生支持精度。

就在数天前,英伟达CEO黄仁勋在接受外媒采访时表示,假设DeepSeek-V4是针对华为优化的,那将使美国处于劣势。他直言,如果建立两个生态系统——一个是只能运行在外国技术栈上的开源生态系统,另一个是运行在美国技术栈上的封闭生态系统——那将是极其愚蠢的。

 


免费推广,免费采购
赚的实在
面向全球60多个国家的
资源流通,覆盖多产业链
专注工业电子,有效沟通
做生意有效率
精选优质商家
您的选择有保障