总分第一!翻译第一!讯飞星火大模型传媒方向评测居首
7月4日消息,经北京大学、清华大学、浙江大学、中国传媒大学等高校教授的学术指导,北京智源研究院、中国经济传媒协会联合新京报共同发布了《大语言模型传媒方向能力测评调研报告》。
测评报告涵盖了包括讯飞星火、文心一言、通义千问在内的9大国内主流大模型产品。
报告的评估体系涵盖了文本生成、事实核查与价值观判断、媒体信息检索、翻译能力以及长文本处理等五个关键能力维度,全面反映了媒体行业对AI技术的需求和期待。
值得注意的是,如果将本次测评报告中所有五项维度的平均分进行横向比较,大模型的翻译能力得分6.42排名第一,在这一单项评测中,讯飞星火得分6.84排名第一。

作为人工智能“国家队”成员,科大讯飞星火大模型在传媒方向能力评测中取得这一成绩并不意外,尤其在智能翻译方面,科大讯飞有着深厚的技术积累和持续的技术创新。
在刚刚举行的国家科学技术奖励大会中,科大讯飞主导的《多语种智能语音技术及产业化》项目摘得国家科学技术进步奖一等奖,这是深度学习引发的新一代人工智能全球浪潮以来,人工智能项目首次荣获中国科技领域高荣誉。

值得一提的是,本次贝壳财经峰会大模型评测报告的评测版本为讯飞星火V3.5,而在6月27日,科大讯飞全新发布了讯飞星火大模型V4.0,宣布全面对标GPT-4 Turbo,并在文本生成、语言理解、知识问答、逻辑推理、数学能力等方面实现超越,在国内外中英文12项大模型主流测试集中,讯飞星火在其中8个测试集排名第一。
讯飞星火V4.0带来底座能力提升的同时,全新发布的星火企业智能体平台也成为备受传媒行业欢迎的大模型产品,智能体平台的“任务链”功能可以自动链接外部权威信源,“知识库”功能可以自动链接企业内部知识系统,打通内外信息鸿沟。
媒体人士表示:无论内部信息的纵向挖掘,还是外部信息的横向整合,智能体平台不仅提升媒体行业工作效率,对于从业人员的工作方式也将带来深远影响。
本文链接:http://www.vogav.com/v4610.html总分第一!翻译第一!讯飞星火大模型传媒方向评测居首
-
动画设计师如何通过SSD提升工作效率
随着科技的进步和计算机性能的提高,动画设计行业也变得越来越重要。无论是电影、电视剧还是游戏都离不开精美的动画效果。在这个竞争激烈的行业中,提升工作效率是非常关键的
-
哈勃望远镜进入暮年:陀螺仪仅剩2个可工作 计划2030年退役
6月5日消息,据媒体报道,美国国家航空航天局(NASA)近日宣布,哈勃太空望远镜的陀螺仪数量已锐减至仅剩两个可正常工作。针对此情况,NASA计划将望远镜调整至单
-
民用无人机高运输记录!大疆FC30珠峰实测:6000米稳载15公斤
6月5日消息,DJI大疆今日宣布,首次在珠穆朗玛峰南坡地区进行了无人机高海拔运输测试,这也是运载无人机在海拔5300米至6000米航线上的首次往返运输测试,创造
-
浏览器的无痕浏览模式真的足够隐私吗
现在个人隐私保护成为了广泛关注的话题。浏览器的“无痕浏览”或“隐私模式”作为一种常见的隐私保护手段,被广泛认为能够在一定程度上保护用户的浏览隐私。然而,无痕浏览模
-
贵州建成全球首条400G算力通道:贵阳到深圳数据传输只需10毫秒
6月14日消息,据媒体报道,全球首条400G算力通道落地贵阳,数据从贵阳传输到广州、深圳仅需10毫秒,到杭州需16毫秒。据悉,贵州,自2014年起便坚定实施大数据战略
-
NVMe固态硬盘与SATA SSD哪个更好
存储技术的每一次革新都在推动着计算机性能的飞跃,随着固态硬盘(SSD)的普及,NVMe 固态硬盘与 SATA SSD 成为了用户升级或新购存储设备时难以绕过的选项。这两种技术,一边是以闪