清溪 AI头条 2025-11-26

阿里 Qwen3-VL 登顶 SpatialBench 榜单：空间推理获 13.5 分刷新 SOTA 纪录，3D 检测能力再获提升

AI 概述

11月26日，空间推理基准测试SpatialBench更新榜单，阿里千问视觉理解模型Qwen3-VL、Qwen2.5-VL位列前二，超越国际顶尖模型。该榜单专注2D/3D空间等复杂任务，是“具身智能试金石”。Qwen3-VL有3D检测升级、视觉编程等亮点，规模多样；Qwen2.5-VL已全量开源，Qwen3-VL预计2025年Q2释放权重与工具链。此外，Qwen3-VL已在多场景POC，2026年将推“视觉 - 动作”端到端模型。

11 月 26 日，空间推理基准测试 SpatialBench 更新了最新一期榜单，阿里千问的视觉理解模型 Qwen3-VL、Qwen2.5-VL 位列头两名，超越 Gemini 3、GPT-5.1、Claude Sonnet4.5 等国际顶尖模型。

SpatialBench 榜单显示，Qwen3-VL-235B 和 Qwen2.5-VL-72B 分别斩获 13.5 和 12.9 分，领先于 Gemini 3.0 Pro Preview（9.6）、GPT-5.1（7.5）、Claude Sonnet 4.5 等海外顶尖模型，距离人类基线 80 分再近一步。

榜单特点

SpatialBench 专注 2D/3D 空间、结构、路径推理，含电路分析、CAD 工程、分子生物学等复杂任务，被视为“具身智能试金石”。

模型亮点

3D 检测升级:Qwen3-VL 新增旋转框输出与深度估计头，遮挡场景 AP↑18%，可判断物体方位、视角变化
视觉编程:输入草图或 10 秒短视频即可生成可运行 Python+OpenCV 代码，实现“所见即所得”
规模多样:提供 2B/4B/8B/32B 密集模型及 30B-A3B、235B-A22B MoE 版本，推理版在 32 项核心能力测试中平均超越 Gemini2.5-Pro6.4 分

开源节奏

Qwen2.5-VL 已全量开源;Qwen3-VL 预计 2025 年 Q2 释放权重与工具链，同步上线千问 App 免费体验。

落地进展

阿里云透露，Qwen3-VL 已在物流机器人、AR 装配、智慧港口等场景 POC，空间定位误差<2cm，2026 年将推出“视觉-动作”端到端模型，为机器人提供实时视觉伺服能力。

目前，Qwen3-VL 已开源不同版本，包括 2B、4B、8B、32B 等密集模型以及 30B-A3B、235B-A22B 等 MoE 模型，每个模型都有指令版和推理版两款，是当下最受企业和开发者欢迎的开源视觉理解模型。同时，Qwen3-VL 模型也已上线千问 APP，用户可免费体验。

以上关于阿里 Qwen3-VL 登顶 SpatialBench 榜单：空间推理获 13.5 分刷新 SOTA 纪录，3D 检测能力再获提升的文章就介绍到这了，更多相关内容请搜索码云笔记以前的文章或继续浏览下面的相关文章，希望大家以后多多支持码云笔记。

「点点赞赏，手留余香」

赞 1 赏

给作者打赏，鼓励TA抓紧创作！

微信

支付宝

还没有人赞赏，快来当第一个赞赏的人吧！

声明：本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。
如若内容造成侵权/违法违规/事实不符，请将相关资料发送至 admin@mybj123.com 进行投诉反馈，一经查实，立即处理！
重要：如软件存在付费、会员、充值等，均属软件开发者或所属公司行为，与本站无关，网友需自行判断
码云笔记 » 阿里 Qwen3-VL 登顶 SpatialBench 榜单：空间推理获 13.5 分刷新 SOTA 纪录，3D 检测能力再获提升

清溪普通

分享到：

清溪 普通

相关推荐

发表回复 取消回复

清溪普通

发表回复取消回复