阿里 Qwen3-VL 登顶 SpatialBench 榜单:空间推理获 13.5 分刷新 SOTA 纪录,3D 检测能力再获提升
11 月 26 日,空间推理基准测试 SpatialBench 更新了最新一期榜单,阿里千问的视觉理解模型 Qwen3-VL、Qwen2.5-VL 位列头两名,超越 Gemini 3、GPT-5.1、Claude Sonnet4.5 等国际顶尖模型。
SpatialBench 榜单显示,Qwen3-VL-235B 和 Qwen2.5-VL-72B 分别斩获 13.5 和 12.9 分,领先于 Gemini 3.0 Pro Preview(9.6) 、GPT-5.1(7.5)、Claude Sonnet 4.5 等海外顶尖模型,距离人类基线 80 分再近一步。

榜单特点
SpatialBench 专注 2D/3D 空间、结构、路径推理,含电路分析、CAD 工程、分子生物学等复杂任务,被视为“具身智能试金石”。
模型亮点
- 3D 检测升级:Qwen3-VL 新增旋转框输出与深度估计头,遮挡场景 AP↑18%,可判断物体方位、视角变化
- 视觉编程:输入草图或 10 秒短视频即可生成可运行 Python+OpenCV 代码,实现“所见即所得”
- 规模多样:提供 2B/4B/8B/32B 密集模型及 30B-A3B、235B-A22B MoE 版本,推理版在 32 项核心能力测试中平均超越 Gemini2.5-Pro6.4 分
开源节奏
Qwen2.5-VL 已全量开源;Qwen3-VL 预计 2025 年 Q2 释放权重与工具链,同步上线千问 App 免费体验。
落地进展
阿里云透露,Qwen3-VL 已在物流机器人、AR 装配、智慧港口等场景 POC,空间定位误差<2cm,2026 年将推出“视觉-动作”端到端模型,为机器人提供实时视觉伺服能力。
目前,Qwen3-VL 已开源不同版本,包括 2B、4B、8B、32B 等密集模型以及 30B-A3B、235B-A22B 等 MoE 模型,每个模型都有指令版和推理版两款,是当下最受企业和开发者欢迎的开源视觉理解模型。同时,Qwen3-VL 模型也已上线千问 APP,用户可免费体验。
以上关于阿里 Qwen3-VL 登顶 SpatialBench 榜单:空间推理获 13.5 分刷新 SOTA 纪录,3D 检测能力再获提升的文章就介绍到这了,更多相关内容请搜索码云笔记以前的文章或继续浏览下面的相关文章,希望大家以后多多支持码云笔记。
如若内容造成侵权/违法违规/事实不符,请将相关资料发送至 admin@mybj123.com 进行投诉反馈,一经查实,立即处理!
重要:如软件存在付费、会员、充值等,均属软件开发者或所属公司行为,与本站无关,网友需自行判断
码云笔记 » 阿里 Qwen3-VL 登顶 SpatialBench 榜单:空间推理获 13.5 分刷新 SOTA 纪录,3D 检测能力再获提升

微信
支付宝