DeepSeek“小更新”表现远超预期代码能力显著提升

2025-03-25 23:43:59 互联网绿达之家网112

核心提示：昨晚，DeepSeek 无预警发布了 DeepSeek-V3-0324 模型。虽然官方低调地称其为“小版本迭代”，但实测表现远超预期

昨晚，DeepSeek 无预警发布了 DeepSeek-V3-0324 模型。虽然官方低调地称其为“小版本迭代”，但实测表现远超预期。该模型在代码生成、前端开发等方面显著提升，部分能力甚至比肩 Claude 3.7 Sonnet，引发了全球 AI 社区的热议。

DeepSeek“小更新”表现远超预期

在大模型竞技场测试 KCORES 中，DeepSeek-V3-0324 的代码能力得分为 328.3 分，超越了普通版 Claude 3.7 Sonnet 的 322.3 分，接近 Claude 3.7 Sonnet 思维链版本的 334.8 分。在 Aider LLM Leaderboard 排行榜中，DeepSeek-V3-0324 在多语言基准测试中的得分为 55%，比 V3 有显著提升，略低于 R1。在非思考/推理模型中，它排名第二，仅次于 Claude Sonnet 3.7。

DeepSeek“小更新”表现远超预期代码能力显著提升

测试数据还显示，在表现良好的模型中，DeepSeek-V3-0324 的花费最低，比 R1 低很多，仅需约 1/5 的成本，具有极高的性价比。Claude Sonnet 3.7 Thinking 的花费是 DeepSeek-V3-0324 的 33 倍，o1 则是其 167 倍。

DeepSeek“小更新”表现远超预期代码能力显著提升

目前在 DeepSeek 官网上，只需关闭“深度思考”选项即可使用新模型。Hugging Face 上也提供了开源下载。DeepSeek-V3-0324 包含 685B 参数，较前代 V3 小幅增加，采用 MoE（专家混合）架构，激活参数 370 亿。网友实测 DeepSeek-V3-0324 支持 4-bit 量化，可在 512GB M3 Ultra Mac 上以 20+ token/s 速度运行，磁盘占用仅 352GB。新模型采用与 DeepSeek-R1 相同的 MIT 许可，允许自由修改、商用及模型蒸馏，比上一版 V3 更开放。

DeepSeek小更新表现远超预期

免责声明：以上所展示的信息由网友自行发布，内容的真实性、准确性和合法性由发布者负责。绿达之家网对此不承担任何保证责任, 绿达之家网仅提供信息存储空间服务。任何单位或个人如对以上内容有权利主张（包括但不限于侵犯著作权、商业信誉等），请与我们联系并出示相关证据，我们将按国家相关法规即时移除。

本文地址:http://news.tianlu58.com/355288.html

收藏 0打赏 0

更多>同类资讯

推荐图文

新加坡：高年级男生霸	26岁设计师凌晨猝死办
骚扰中国女子的日籍男	高端酒店减塑困局：禁
高三生回应学习困难去	普京责问官员：GDP萎
南京一市场物流强收小	飞天茅台价格全线上涨

推荐资讯

点击排行

网站首页 | 网站地图 | 排名推广 | SiteMap

免责声明：本站所有信息均来自互联网搜集，产品相关信息的真实性准确性均由发布单位及个人负责，请大家仔细辨认！并不代表本站观点,绿达之家网对此不承担任何相关法律责任！如有信息侵犯了您的权益，请告知，本站将立刻删除。
友情提示：买产品需谨慎
网站资讯与建议：ldzjw@foxmail.com

DeepSeek“小更新”表现远超预期 代码能力显著提升

DeepSeek“小更新”表现远超预期代码能力显著提升