阿里云发布通义千问2.5版 性能赶超了GPT-4Turbo

阿里云今日正式发布通义千问 2.5 版本,该版本在模型性能上全面赶超了 GPT-4Turbo,展现了其强大的技术实力。与此同时,通义千问最新开源的 1100 亿参数模型 Qwen1.5-110B 在多个基准测评中取得了卓越成绩,超越了 Meta 的 Llama-3-70B 模型,成为开源领域的新星。

与通义千问 2.1 版本相比,2.5 版本在理解能力、逻辑推理、指令遵循和代码能力等方面均有了显著提升。具体而言,理解能力提升了 9%,逻辑推理能力提升了 16%,指令遵循能力提升了 19%,而代码能力则提升了 10%。这一飞跃性的进步使得通义千问 2.5 在权威基准 OpenCompass 上的得分与 GPT-4Turbo 持平,证明了其在自然语言处理领域的领先地位。

阿里云发布通义千问 2.5 版 性能赶超了 GPT-4Turbo

除了通义千问 2.5 的发布,通义还推出了最新款开源模型 Qwen1.5-110B。这款拥有 1100 亿参数的模型在 MMLU、TheoremQA、GPQA 等基准测评中均表现出色,成功超越了 Meta 的 Llama-3-70B 模型。在 HuggingFace 推出的开源大模型排行榜 Open LLM Leaderboard 上,Qwen1.5-110B 更是荣登榜首,进一步巩固了通义开源系列在业界的领先地位。

通义的多模态模型和专有能力模型同样令人瞩目。其中,通义千问视觉理解模型 Qwen-VL-Max 在多个多模态标准测试中超越了 Gemini Ultra 和 GPT-4V,其强大的视觉理解能力已经在实际应用中得到了广泛验证。而通义千问代码大模型 CodeQwen1.5-7B 则是 HuggingFace 代码模型榜单 Big Code 的头名选手,展现了其在代码生成和代码理解方面的卓越能力。

这一模型的推出不仅满足了开发者对于高效代码生成的需求,也为企业客户提供了更为智能的代码管理和优化解决方案。

「点点赞赏,手留余香」

0

给作者打赏,鼓励TA抓紧创作!

微信微信 支付宝支付宝

还没有人赞赏,快来当第一个赞赏的人吧!

声明:本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系maynote@foxmail.com处理
码云笔记 » 阿里云发布通义千问2.5版 性能赶超了GPT-4Turbo

发表回复