阿里除夕夜抛出重磅新模型 Qwen2.5-Max性能惊艳

2025-01-30 00:53:46 互联网绿达之家网90

核心提示：农历除夕夜，全球华人喜迎新春之时，纽约证券交易所的电子屏上，阿里巴巴美股股价在收盘前从涨幅1%快速拉升至6.7%。这一行情异动背后，是一场技术上的奇袭

农历除夕夜，全球华人喜迎新春之时，纽约证券交易所的电子屏上，阿里巴巴美股股价在收盘前从涨幅1%快速拉升至6.7%。这一行情异动背后，是一场技术上的奇袭。

阿里除夕夜抛出重磅新模型

1月29日凌晨，阿里通义千问团队悄然上线了大模型Qwen2.5-Max，在多个权威基准测试中展现出与全球顶级模型比肩的性能。这是继DeepSeek之后，中国AI阵营在高性能、低成本技术路线上的又一重要突破。

阿里除夕夜抛出重磅新模型 Qwen2.5-Max性能惊艳

市场人士分析称，此前过度聚焦DeepSeek，却忽视了包括阿里通义在内的中国AI整体性追赶。行业媒体《信息平权》表示，若阿里Qwen-2.5-max的性能超过V3，可以对其RL推理模型给予更大期待。

阿里除夕夜抛出重磅新模型 Qwen2.5-Max性能惊艳

当阿里云展现出“强大模型+充足算力+完整云平台”的组合优势时，是否印证了类似去年北美云计算服务商的投资逻辑？如果美股因AI整体增值10万亿美元，中国AI资产的重估时机是否已至？

Qwen2.5-Max采用超大规模MoE（混合专家）架构，基于超过20万亿token的预训练数据。在MMLU-Pro、LiveCodeBench、LiveBench以及Arena-Hard等多个权威评测中，该模型均展现出与DeepSeek V3、GPT-4和Claude-3.5-Sonnet比肩甚至领先的性能。阿里团队表示，随着后训练技术的进步，下一个版本将有望达到更高水平。

Qwen2.5团队同步发布了两个创新型号：Qwen2.5-7b-instruct-1m和Qwen2.5-14b-instruct-1m。这些开源模型支持高达100万token的上下文窗口，成为业内首个达到此规模的公开可用模型。这些模型使用稀疏注意力，处理百万token输入的速度比传统方法快3到7倍，输出长度可达8000个token。

阿里除夕夜抛出重磅新模型

免责声明：以上所展示的信息由网友自行发布，内容的真实性、准确性和合法性由发布者负责。绿达之家网对此不承担任何保证责任, 绿达之家网仅提供信息存储空间服务。任何单位或个人如对以上内容有权利主张（包括但不限于侵犯著作权、商业信誉等），请与我们联系并出示相关证据，我们将按国家相关法规即时移除。

本文地址:http://news.tianlu58.com/348825.html

收藏 0打赏 0

更多>同类资讯

推荐图文

刚满月宝宝被“保姆”	湖南“龙超”赫山站燃
世体称姆巴佩在法国队	刘殿座代表国足出战感
微信上新网友：终于	蛟龙号在海底2000米看
澳大利亚查获价值20万	林书豪：太火热主场氛

推荐资讯

点击排行

网站首页 | 网站地图 | 排名推广 | SiteMap

免责声明：本站所有信息均来自互联网搜集，产品相关信息的真实性准确性均由发布单位及个人负责，请大家仔细辨认！并不代表本站观点,绿达之家网对此不承担任何相关法律责任！如有信息侵犯了您的权益，请告知，本站将立刻删除。
友情提示：买产品需谨慎
网站资讯与建议：ldzjw@foxmail.com