阿里发布通义千问2.5,号称赶超GPT-4 Turbo
阿里云在 2024 年 5 月 9 日正式发布了通义千问 2.5。该版本在模型性能上全面超越了 GPT-4Turbo,成为地表最强中文大模型。此外,通义千问最新开源的 1100 亿参数模型在多个基准测评中收获最佳成绩,超越 Meta 的 Llama-3-70B,成为开源领域最强大模型。

性能提升
相比于之前的通义千问 2.1 版本,通义千问 2.5 在理解能力、逻辑推理、指令遵循、代码能力等方面分别提升了 9%、16%、19%、10%,其中文能力更是持续领先业界。在权威基准 OpenCompass 上,通义千问 2.5 的得分追平了 GPT-4Turbo,这是该基准首次录得国产大模型取得如此出色的成绩。
开源模型
除了通义千问 2.5 之外,阿里云还发布了 1100 亿参数的开源模型 Qwen1.5-110B。该模型在 MMLU、TheoremQA、GPQA 等基准测评中超越了 Meta 的 Llama-3-70B 模型,并在 HuggingFace 推出的开源大模型排行榜 OpenLLMLeaderboard 上冲上了榜首,这再次证明了通义开源系列业界最强的竞争力。
多模态模型和专有能力模型
通义的多模态模型和专有能力模型也具备业界顶尖影响力。例如,通义千问视觉理解模型 Qwen-VL-Max 在多个多模态标准测试中超越了 GeminiUltra 和 GPT-4V,目前已在多家企业落地应用。此外,通义千问代码大模型 CodeQwen1.5-7B 则是 HuggingFace 代码模型榜单 BigCode 的头名选手,还是国内用户规模第一的智能编码助手通义灵码的底座。
本文链接:http://www.vogav.com/v1249.html阿里发布通义千问2.5,号称赶超GPT-4 Turbo
-
vivo X100 Ultra 手机开售,售价 6499 元起
5 月 2
-
酷态科电能块自带线 20000mAh 充电宝开启预售
5 月 2
-
vivo WATCH GT 智能手表功能细节公布
5 月 2
-
夏天必备!啄木鸟新款凉鞋大促:到手19.9元 多款可选
夏日清爽必备,啄木鸟夏季新款凉鞋官方标价157.9元,今日可领138元优惠券,到手仅需19.9元,包邮。产品规格:多种款式可选,鞋底防滑,柔软脚感,缓震回弹,可调节后跟
-
暴雪回来了!《魔兽世界》官宣国服删档技术测试6月11日开启:不限号
6月6日消息,今日,《魔兽世界》官微宣布,国服删档技术测试将于6月11日开启。据介绍,6月11日起将开启为期7天的“巫妖王之怒”技术测试,将通过此次
-
领先行业!荣耀首款小折叠Magic V Flip用上4英寸外屏:尺寸和iPhone 5一样大
6月6日消息,荣耀首款小折叠Magic V Flip将于6月13日发布,新机号称“行业大”的外屏。荣耀Magic V Flip外屏究竟有多大?荣耀终端有限公司产品线