视频会议巨头Zoom强势“跨界”,联邦AI赋能创全球最难AI考试新纪录

长久以来,大模型领域的顶尖竞争一直被谷歌、OpenAI 以及 Anthropic 等科技巨头所主导。然而,上周视频会议领域的领军企业 Zoom 抛出了一枚重磅消息:其人工智能系统在素有“人类终极挑战”(Humanity’s Last Exam,简称 HLE)之称的顶级评测中,以 48.1%的优异成绩刷新了全球纪录,一举超越了此前由谷歌 Gemini3Pro 保持的 45.8%的成绩。
不拼模型拼“策略”:联邦式 AI 新路径
面对“非底层模型厂商如何逆袭模型巨头”的质疑,Zoom 首席技术官、前微软 AI 领域的杰出人物黄学东(Xuedong Huang)给出了一个与众不同的回答。Zoom 并未选择斥巨资训练自己的万亿参数级大模型,而是精心打造了一套“联邦式人工智能方法”:
Z 评分器(Z-Scorer):作为系统的核心中枢,它负责实时评估来自 OpenAI、Google 和 Anthropic 等多家模型的响应,为特定任务挑选出最佳解决方案。
探索-验证-联合策略:这是一套智能体(Agent)的工作流程,通过让多个 AI 系统进行“辩论式协作”,相互挑战并不断完善推理结果。
流量控制器:简而言之,Zoom 构建了一个极为智能的 AI“调度中心”,通过集成而非自主研发,实现了“超越任何单一模型极限”的卓越性能。
争议漩涡:是真创新还是“借鸡生蛋”?
这一成绩在开发者社区引发了激烈的争论。以工程师 Max Rumpf 为代表的一派批评者认为,Zoom 只是通过 API“借用”了别人的成果,在对于实际用户意义不大的基准测试中刷分,这种“窃取他人劳动成果”的行为并没有实质性的技术贡献。
然而,另一派观察家如开发者朱宏成则持不同观点,他认为在 AI 评估中胜出必然需要“模型联邦”的策略。这就像数据竞赛平台 Kaggle 的获胜者总是依赖模型集成,而非单打独斗。这种策略在商业上极为明智:它避免了高昂的算力投入,同时让 Zoom 能够在不同供应商之间灵活选择,彻底摆脱了供应商锁定的困境。
从排行榜到实战:AI Companion3.0 的严峻考验
黄学东将这一成就视为对 Zoom 战略的肯定。对于 Zoom 的 3 亿用户而言,更有意义的较量将在即将推出的 AI Companion3.0 中展开。尽管 48.1%在 HLE 这种涵盖高等数学与哲学的考试中代表了机器智能的顶尖水平,但用户更关心的是:当数亿人开始使用它总结会议、提取行动项时,这套“联邦大脑”是否真的能比单一模型更高效、更准确。
以上关于视频会议巨头Zoom强势“跨界”,联邦AI赋能创全球最难AI考试新纪录的文章就介绍到这了,更多相关内容请搜索码云笔记以前的文章或继续浏览下面的相关文章,希望大家以后多多支持码云笔记。
如若内容造成侵权/违法违规/事实不符,请将相关资料发送至 admin@mybj123.com 进行投诉反馈,一经查实,立即处理!
重要:如软件存在付费、会员、充值等,均属软件开发者或所属公司行为,与本站无关,网友需自行判断
码云笔记 » 视频会议巨头Zoom强势“跨界”,联邦AI赋能创全球最难AI考试新纪录
微信
支付宝