阿里巴巴通义Qwen3上线非思考模型,核心能力与GPT-4o相当
7 月 30 日,科技圈迎来重磅消息,阿里巴巴旗下通义千问团队火力全开,正式推出 Qwen3 系列模型的全新力作 ——Qwen3-30B-A3B-Instruct-2507 。这一全新开源模型剑走偏锋,采用独特的非思考模式(non-thinking mode),仅需激活 3B 参数,便在多个核心能力维度上成功突围,与 Gemini2.5-Flash、GPT-4o 等知名闭源模型站在了同一水平线,引发行业内外高度关注。

从性能表现来看,Qwen3-30B-A3B-Instruct-2507 堪称惊艳。官方数据显示,在数学推理领域,其 AIME25 测试得分高达 61.3 ,展现出强大的逻辑思维与运算能力;代码生成方面,LiveCodeBenchv6 测试得分 43.2 ,意味着开发者利用该模型能够更高效地生成高质量代码;面对研究生级别的物理与天文学复杂问题,它在 GPQA 测试中取得 70.4 的好成绩 ,对专业知识的理解与解答能力不容小觑;在人类偏好对齐的 Arena-Hard v2 测试里,得分 69 ,表明模型生成的内容能更好贴合用户需求与偏好。值得一提的是,在部分指标上,Qwen3-30B-A3B-Instruct-2507 甚至成功超越 GPT-4o ,充分彰显了其在逻辑推理、数学、科学和编程等多领域的深厚实力。
除了上述亮眼表现,Qwen3-30B-A3B-Instruct-2507 还在多语言支持、用户偏好对齐和长文本处理方面实现重大突破。在全球化浪潮下,多语言能力愈发重要,该模型在多语言的长尾知识覆盖上表现卓越,能够轻松应对不同语言背景的知识需求;在主观和开放任务中,它能精准捕捉用户意图,更好地对齐用户偏好,生成高质量文本,为用户提供更具价值、更贴合心意的答案。尤为引人注目的是,其长文本理解能力提升至 256K ,这意味着用户可以借助它处理篇幅更长、结构更复杂的文本内容,无论是学术论文、商业报告,还是长篇小说分析,它都能游刃有余。
目前,Qwen3-30B-A3B-Instruct-2507 已在魔搭社区(ModelScope)和 HuggingFace 平台全面开源 ,全球开发者、研究人员以及企业均可免费获取、使用。作为 Qwen3-30B-A3B 系列的新版本,它不仅传承了通义千问团队在架构创新上的优势基因,还巧妙优化计算成本,力求在有限资源下,实现与千亿级闭源模型性能的接轨,让更多用户能够以较低门槛享受到顶尖 AI 模型的服务。
自 2023 年通义千问系列模型发布以来,其开源之路可谓成果丰硕。截至目前,已累计开源超过 200 个模型,全球下载量强势突破 3 亿次,衍生模型数量更是超过 10 万个 。庞大的下载量与衍生模型规模,不仅反映出市场对通义千问系列模型的高度认可,更彰显出其强大的技术潜力与市场影响力,为 AI 领域的创新发展注入源源不断的活力。Qwen3-30B-A3B-Instruct-2507 的诞生,无疑是通义千问团队在开源征程上的又一里程碑,有望在未来推动 AI 技术迈向新的高度,在更多应用场景中落地生根,惠及大众。
以上关于阿里巴巴通义Qwen3上线非思考模型,核心能力与GPT-4o相当的文章就介绍到这了,更多相关内容请搜索码云笔记以前的文章或继续浏览下面的相关文章,希望大家以后多多支持码云笔记。
如若内容造成侵权/违法违规/事实不符,请将相关资料发送至 admin@mybj123.com 进行投诉反馈,一经查实,立即处理!
重要:如软件存在付费、会员、充值等,均属软件开发者或所属公司行为,与本站无关,网友需自行判断
码云笔记 » 阿里巴巴通义Qwen3上线非思考模型,核心能力与GPT-4o相当

微信
支付宝