阿里发布通义千问2.5,号称赶超GPT-4 Turbo
阿里云在 2024 年 5 月 9 日正式发布了通义千问 2.5。该版本在模型性能上全面超越了 GPT-4Turbo,成为地表最强中文大模型。此外,通义千问最新开源的 1100 亿参数模型在多个基准测评中收获最佳成绩,超越 Meta 的 Llama-3-70B,成为开源领域最强大模型。

性能提升
相比于之前的通义千问 2.1 版本,通义千问 2.5 在理解能力、逻辑推理、指令遵循、代码能力等方面分别提升了 9%、16%、19%、10%,其中文能力更是持续领先业界。在权威基准 OpenCompass 上,通义千问 2.5 的得分追平了 GPT-4Turbo,这是该基准首次录得国产大模型取得如此出色的成绩。
开源模型
除了通义千问 2.5 之外,阿里云还发布了 1100 亿参数的开源模型 Qwen1.5-110B。该模型在 MMLU、TheoremQA、GPQA 等基准测评中超越了 Meta 的 Llama-3-70B 模型,并在 HuggingFace 推出的开源大模型排行榜 OpenLLMLeaderboard 上冲上了榜首,这再次证明了通义开源系列业界最强的竞争力。
多模态模型和专有能力模型
通义的多模态模型和专有能力模型也具备业界顶尖影响力。例如,通义千问视觉理解模型 Qwen-VL-Max 在多个多模态标准测试中超越了 GeminiUltra 和 GPT-4V,目前已在多家企业落地应用。此外,通义千问代码大模型 CodeQwen1.5-7B 则是 HuggingFace 代码模型榜单 BigCode 的头名选手,还是国内用户规模第一的智能编码助手通义灵码的底座。
本文链接:http://www.vogav.com/v1249.html阿里发布通义千问2.5,号称赶超GPT-4 Turbo
-
剪映支持杜比视界格式视频制作,助力提升视频创作品质
杜比视界(Dolby Vision)是一种先进的 HDR(高动态范围)技术,它能够充分发挥显示设备的色彩和明暗对比优势。这项技术通过动态元数据处理,能够根据不同的场景进行实时优化,从而为用
-
Google为苹果手机推出圈选即搜功能
圈选即搜功能 是一种新型的搜索方式,允许用户通过在屏幕上绘制一个圈或高亮某个区域,来快速搜索和获取相关信息。这项功能最初是由谷歌与三星合作,在 2024 年 1 月 31 日面向
-
堵死降级路!苹果关闭iOS 17.5验证通道:新版iOS 17.5.1已上线
5月29日消息,今日,苹果宣布关闭iOS 17.5验证通道,意味着已经升级新版iOS的用户无法降级。在苹果看来,升级系统会给用户带来新的功能体验,同时修复旧版本的
-
机械师L8Air/Max“十周年纪念”星闪鼠标开启预售
5 月 2
-
王腾向卢伟冰介绍Redmi未来旗舰:非常非常强
6月6日消息,卢伟冰发微博表示,王腾给我介绍了一款Redmi未来的新旗舰产品,非常非常强,他越讲越激动。网友猜测,这款未来旗舰是Redmi K80 Pro。此前博主数码
-
ROG掌机X正式发布,采用AMD锐龙Z1 Extreme APU
ROG 掌机 X 已于 2024 年 6 月 2 日在 Computex 2024 上正式发布。这款掌机是在前一代 ROG 掌机的基础上进行了全面的更新和升级,无论是在性能、续航、握持感、拓展性还是软