DeepSeek V4中文能力测评出炉:重回国内第一

业界
2026
04/28
10:28
快科技
分享
评论

4月28日消息,SuperCLUE团队发布DeepSeek V4系列中文大模型测评结果,DeepSeek-V4-Pro凭借综合表现拿下国内第一,Flash版本紧随其后位居第二,国产开源模型再迎突破。

本次测评覆盖数学推理、科学推理、代码生成、智能体任务规划、指令遵循、幻觉控制六大维度,Pro版本得分70.98分,Flash版本68.82分,两项成绩均大幅领先国内其他模型。

DeepSeek V4中文能力测评出炉:重回国内第一!

DeepSeek V4系列采用全新注意力机制,全版本支持百万级长上下文,同时降低算力与显存占用,搭配国产芯片使用,整体效率更高。

相比上一代 V3.2,两个版本均实现全面提升。Pro版本智能体能力提升超20分,数学推理提升近10分,指令遵循提升近12分,幻觉控制也有明显优化。

DeepSeek V4中文能力测评出炉:重回国内第一!

Flash版本在保持高效推理的同时,智能体与数学推理同样大幅提升,性价比突出。

DeepSeek V4中文能力测评出炉:重回国内第一!

Pro版本(15元/百万Tokens)侧重高性能,幻觉控制更稳,适合复杂任务与专业场景。Flash 版本速度更快、成本更低,API价格仅1.25元每百万Tokens,日常使用更划算。

测评同时指出,模型与海外顶尖模型在代码生成、复杂指令执行等方面仍有差距。整体来看,DeepSeek V4凭借均衡能力与亲民成本,站稳国内第一梯队,成为日常办公、开发创作、长文本处理的优质选择。

【来源:科技

THE END
广告、内容合作请点击这里 寻求合作
DeepSeek
免责声明:本文系转载,版权归原作者所有;旨在传递信息,不代表砍柴网的观点和立场。

相关热点

北京时间4月24日,据《金融时报》报道,AI创业公司DeepSeek正在进行首次外部融资,目的是为了留住那些以股票期权作为薪酬的员工,防止他们被竞争对手挖走。
业界
4月16日消息,DeepSeek V4预计本月下旬发布,这次发布比大家的预期更晚一些,很大一个原因就是DeepSeek V4会全面支持国产AI平台,尤其是华为昇腾平台。
业界
3月25日消息,近日,一首名为《七天爱人》的歌曲在网络上引发了广泛关注。
业界
3月12日消息,作为国产大模型中最受期待的明星,DeepSeek V4最近一直被传发布,但都落空了,现在又有新的大模型引发热议。
业界
1 月 21 日消息,The Information 月初爆料称,DeepSeek 将在今年 2 月中旬农历新年期间推出新一代旗舰 AI 模型 ——DeepSeek V4,将具备更强的写代码能力。
业界

相关推荐

1
3