阿里发布通义千问2.5,号称赶超GPT-4 Turbo
阿里云在 2024 年 5 月 9 日正式发布了通义千问 2.5。该版本在模型性能上全面超越了 GPT-4Turbo,成为地表最强中文大模型。此外,通义千问最新开源的 1100 亿参数模型在多个基准测评中收获最佳成绩,超越 Meta 的 Llama-3-70B,成为开源领域最强大模型。
性能提升
相比于之前的通义千问 2.1 版本,通义千问 2.5 在理解能力、逻辑推理、指令遵循、代码能力等方面分别提升了 9%、16%、19%、10%,其中文能力更是持续领先业界。在权威基准 OpenCompass 上,通义千问 2.5 的得分追平了 GPT-4Turbo,这是该基准首次录得国产大模型取得如此出色的成绩。
开源模型
除了通义千问 2.5 之外,阿里云还发布了 1100 亿参数的开源模型 Qwen1.5-110B。该模型在 MMLU、TheoremQA、GPQA 等基准测评中超越了 Meta 的 Llama-3-70B 模型,并在 HuggingFace 推出的开源大模型排行榜 OpenLLMLeaderboard 上冲上了榜首,这再次证明了通义开源系列业界最强的竞争力。
多模态模型和专有能力模型
通义的多模态模型和专有能力模型也具备业界顶尖影响力。例如,通义千问视觉理解模型 Qwen-VL-Max 在多个多模态标准测试中超越了 GeminiUltra 和 GPT-4V,目前已在多家企业落地应用。此外,通义千问代码大模型 CodeQwen1.5-7B 则是 HuggingFace 代码模型榜单 BigCode 的头名选手,还是国内用户规模第一的智能编码助手通义灵码的底座。
本文链接:http://www.vogav.com/v1249.html阿里发布通义千问2.5,号称赶超GPT-4 Turbo
-
一步之遥!英伟达股价暴涨近7%:市值距苹果只差1000亿美元
5月29日消息,上周,芯片巨头英伟达公布了一季度财报,各项数据全面超越预期,受亮眼数据推动,英伟达股价首次突破每股1000美元,创历史新高。美股周二收盘,英伟达
-
取代mini-LED!苹果MacBook Pro将采用OLED屏
5月29日消息,Omdia分析师表示,苹果极有可能在2026年推出MacBook Pro OLED设备。Omdia分析师表示,从2023年到2031年,移动PC市场对OLED面板的需求将以37%的
-
驰为 CHUWI 迷你主机开售
5 月 2
-
正宗南阳黄牛!牧牛班熟食卤牛肉大促:买三发四每袋14元
天猫【牧牛班食品旗舰店】牧牛班熟食卤牛肉 150g,日常售价为 29.9 元,下单 3 件发 4 件,叠加满减 + 15 元优惠券,到手价为 56.94 元,折合每袋仅需 14.48 元
-
之前因雪糕高温不化引发争议 钟薛高老板说新品化得非常快
5月29日消息,据国内多家媒体报道,钟薛高创始人林盛被曝悄悄开设直播账号,将带货还债。直播中,林盛数次提到欠薪员工数量为729人,并表示企业经营不善是自己
-
华硕ROG 龙鳞 ACE EXTREME三模无线鼠标发布
6 月 4