阿里通义千问开源负责人林俊旸在X上发文暗示,Qwen3模型有望于4月28日发布。此前,Qwen3系列模型合集曾在阿里巴巴旗下AI模型开源社区ModelScope短暂亮相后下线,包括Qwen3-4B-Base、Qwen3-1.7B、Qwen3-0.6B及Qwen3-30B-A3B-Base四款模型,均采用Apache License 2.0开源协议。尽管官方尚未正式公告,但从命名规则与前代技术逻辑来看,可以推测其技术路径和定位方向。
此次发布的模型中,Qwen3-4B、Qwen3-1.7B和Qwen3-0.6B分别对应40亿、17亿和6亿参数,这类无后缀的命名方式可能表明它们为单架构稠密模型,未采用混合专家(MoE)设计,适合轻量化应用场景。而Qwen3-30B-A3B-Base则是MoE架构的基础模型,总参数300亿(30B),动态调用30亿(3B)参数处理任务。此外,Qwen3支持高达256K的上下文长度,涵盖推理与非推理任务。
自2023年8月以来,阿里云已相继开源了Qwen、Qwen1.5、Qwen2、Qwen2.5等四代模型,涵盖了从0.5B到110B的不同参数规模,涉及大语言、多模态、数学和代码等多种模态。