总分第一!翻译第一!讯飞星火大模型传媒方向评测居首
7月4日消息,经北京大学、清华大学、浙江大学、中国传媒大学等高校教授的学术指导,北京智源研究院、中国经济传媒协会联合新京报共同发布了《大语言模型传媒方向能力测评调研报告》。
测评报告涵盖了包括讯飞星火、文心一言、通义千问在内的9大国内主流大模型产品。
报告的评估体系涵盖了文本生成、事实核查与价值观判断、媒体信息检索、翻译能力以及长文本处理等五个关键能力维度,全面反映了媒体行业对AI技术的需求和期待。
值得注意的是,如果将本次测评报告中所有五项维度的平均分进行横向比较,大模型的翻译能力得分6.42排名第一,在这一单项评测中,讯飞星火得分6.84排名第一。

作为人工智能“国家队”成员,科大讯飞星火大模型在传媒方向能力评测中取得这一成绩并不意外,尤其在智能翻译方面,科大讯飞有着深厚的技术积累和持续的技术创新。
在刚刚举行的国家科学技术奖励大会中,科大讯飞主导的《多语种智能语音技术及产业化》项目摘得国家科学技术进步奖一等奖,这是深度学习引发的新一代人工智能全球浪潮以来,人工智能项目首次荣获中国科技领域高荣誉。

值得一提的是,本次贝壳财经峰会大模型评测报告的评测版本为讯飞星火V3.5,而在6月27日,科大讯飞全新发布了讯飞星火大模型V4.0,宣布全面对标GPT-4 Turbo,并在文本生成、语言理解、知识问答、逻辑推理、数学能力等方面实现超越,在国内外中英文12项大模型主流测试集中,讯飞星火在其中8个测试集排名第一。
讯飞星火V4.0带来底座能力提升的同时,全新发布的星火企业智能体平台也成为备受传媒行业欢迎的大模型产品,智能体平台的“任务链”功能可以自动链接外部权威信源,“知识库”功能可以自动链接企业内部知识系统,打通内外信息鸿沟。
媒体人士表示:无论内部信息的纵向挖掘,还是外部信息的横向整合,智能体平台不仅提升媒体行业工作效率,对于从业人员的工作方式也将带来深远影响。
本文链接:http://www.vogav.com/v4610.html总分第一!翻译第一!讯飞星火大模型传媒方向评测居首
-
英国女子患有罕见梦游症:睡梦中疯狂购物 醒来一脸懵
近日,英国42岁的凯利在媒体上公开承认:自己曾是一个不折不扣的购物狂,几乎每天都会在睡梦中梦游购物。据统计,她稀里糊涂购买的东西,金额已经超过了3000英
-
耗时11年打造!网友直呼川美毕业展《父亲》太震撼了
6月13日消息,据国内多家媒体报道,近期川美毕业展上《父亲》雕塑,以其震撼人心的视觉效果成为瞩目的焦点。该作品把罗中立油画作品《父亲》具象化,耗时11年
-
2023届本科生月均收入6050元:信息安全专业薪资高
6月13日消息,前段时间,“麦可思研究”发布了《2024版就业蓝皮书》,其中提到2023届本科、高职毕业生平均月收入分别为6050元、4683元,较上一届(本
-
疯狂啃食海鸟!南非欲海岛空投550吨特制灭鼠药:一鼠不留
“马里恩灭鼠”计划,将是迄今为止,岛屿上规模大的灭鼠行动。按照计划,该项目将启动4到6架飞机,喷洒超过550吨特制的灭鼠药,为的是消灭岛上数量超
-
为啥有些人数学特别好 研究:大脑和普通人有三个明显区别
6月16日消息,近日,17岁女孩姜萍参加阿里巴巴达摩院全球数学竞赛,以93分、全球排名12的成绩晋级决赛,成为阿里数赛举办以来首位打进决赛的中专在读生,也是前
-
耗资4000万美元造出新细菌!科学狂人又想创造新生命
诺贝尔奖获得者、著名物理学家理查德·费曼曾经说过这么一句话,“What I cannot create, I do not understand”,意思就是,我不能创造的