阿里通义千问 Qwen3 系列模型有望今日发布，支持 256K 上下文长度

更新时间：2025-04-29 00:50:06 发布时间：3小时前浏览：2496 评论：0

收藏

分享

内容摘要IT之家 4 月 28 日消息，阿里通义千问开源负责人林俊旸在 X 上发文暗示，Qwen3 模型有望今日发布。值得一提的是，Qwen3 系列模型合集已在阿里巴巴旗下 AI 模型开源社区 ModelScope（魔搭）短暂亮相后又下线，包括 Q

IT之家 4 月 28 日消息，阿里通义千问开源负责人林俊旸在 X 上发文暗示，Qwen3 模型有望今日发布。

值得一提的是，Qwen3 系列模型合集已在阿里巴巴旗下 AI 模型开源社区 ModelScope（魔搭）短暂亮相后又下线，包括 Qwen3-4B-base、Qwen3-1.7B、Qwen3-0.6B 及 Qwen3-30B-A3B-base 四款模型。所有模型均采用 Apache License 2.0 开源协议。尽管官方尚未发布正式公告，但结合命名规则与前代技术逻辑，可推测其技术路径与定位方向。

此次发布的模型中，Qwen3-4B、Qwen3-1.7B 和 Qwen3-0.6B 以参数规模直接命名，分别对应 40 亿、17 亿和 6 亿参数。此类无后缀的命名方式或表明其为单架构稠密模型，未采用混合专家（MoE）设计，推测主打轻量化应用场景。而 Qwen3-30B-A3B-base 为 MoE 架构基础模型，总参数 300 亿（30B）中动态调用 30 亿（3B）参数处理任务。

另据据 AIbase 报道，Qwen3 支持高达 256K 的上下文长度，涵盖推理与非推理任务。

据IT之家了解，自 2023 年 8 月起，阿里云相继开源 Qwen、Qwen1.5、Qwen2、Qwen2.5 等 4 代模型，囊括了 0.5B、1.5B、3B、7B、14B、32B、72B、110B 等全尺寸，大语言、多模态、数学和代码等全模态。

举报收藏打赏 评论 0

版权声明 本文仅代表作者观点，不代表本站立场。
如遇本文系为网络转载到本站发表，图片或文章有版权问题的请联系客服确认后会立即删除文章。
如遇本文系作者授权本站发表，未经许可，不得转载。

--结束END--

有问题投稿请发送至: 邮箱/

本文标题: 阿里通义千问 Qwen3 系列模型有望今日发布，支持 256K 上下文长度

本文链接: http://m.cnhhw.cn/news/show-247976.html (转载时请保留)

0 条

《哪吒》有望改编游戏引热议：《黑神话》能否改编电影

科技 paint6 ⋅ 6阅读量 ⋅ 0评论 ⋅ 37分钟前

2025-04-29
今年的上海车展缺少热搜：到底怎么了

科技 zhxthai ⋅ 13阅读量 ⋅ 0评论 ⋅ 37分钟前

2025-04-29
保时捷否认在华停售电动汽车：误读在中国将全速推进电动化

科技 jzplastic1 ⋅ 12阅读量 ⋅ 0评论 ⋅ 37分钟前

2025-04-29
朱雀玄武敕令曾诊断出分离型癔症：有时忘记说过的话

科技 zbzyf ⋅ 1阅读量 ⋅ 0评论 ⋅ 37分钟前

2025-04-29
AI下半场百度依然坚挺

科技 bomei16888 ⋅ 8阅读量 ⋅ 0评论 ⋅ 37分钟前

2025-04-29
苹果20周年献礼！纪念版iPhone开发中：外观设计梦幻

科技 cnddmy ⋅ 17阅读量 ⋅ 0评论 ⋅ 37分钟前

2025-04-29
安卓跑分进入400万分时代！高通联发科Soc性能集体爆发

科技 ntsthl ⋅ 3阅读量 ⋅ 0评论 ⋅ 37分钟前

2025-04-29
进一步精简业务，消息称索尼集团正考虑剥离半导体部门

科技 ntsthl ⋅ 6阅读量 ⋅ 0评论 ⋅ 39分钟前

2025-04-29
4.28日复盘暨4.29热点板块、个股预测

科技 xinxinchemical ⋅ 16阅读量 ⋅ 0评论 ⋅ 39分钟前

2025-04-29
回合战略游戏哪些好玩十大经典回合战略游戏精选

科技 xyhersrita ⋅ 15阅读量 ⋅ 0评论 ⋅ 39分钟前

2025-04-29

去ta空间

24小时热闻

今日推荐

(c)2016-2021 SOQUANMAO.COM All Rights Reserved搜全贸版权所有浙ICP备19001410号-1

浙ICP备19001410号-1