首页 > 生活

o1突发内幕曝光?谷歌更早揭示原理 大模型光有软件不存在护城河

2024-09-18 11:08:17
2
来源:

发布不到1周,OpenAI强模型o1的护城河已经没有了。NycVOGAV创新无限-科技改变未来,开启智能新时代vogav.com

有人发现,谷歌DeepMind一篇发表在8月的论文,揭示原理和o1的工作方式几乎一致。NycVOGAV创新无限-科技改变未来,开启智能新时代vogav.com

o1突发内幕曝光?谷歌更早揭示原理 大模型光有软件不存在护城河NycVOGAV创新无限-科技改变未来,开启智能新时代vogav.com

o1突发内幕曝光?谷歌更早揭示原理,大模型光有软件不存在护城河NycVOGAV创新无限-科技改变未来,开启智能新时代vogav.com

这项研究表明,增加测试时(test-time)计算比扩展模型参数更有效。NycVOGAV创新无限-科技改变未来,开启智能新时代vogav.com

基于论文提出的计算优(compute-optimal)测试时计算扩展策略,规模较小的基础模型在一些任务上可以超越一个14倍大的模型。NycVOGAV创新无限-科技改变未来,开启智能新时代vogav.com

网友表示:NycVOGAV创新无限-科技改变未来,开启智能新时代vogav.com

这几乎就是o1的原理啊。NycVOGAV创新无限-科技改变未来,开启智能新时代vogav.com

众所周知,奥特曼喜欢领先于谷歌,所以这才是o1抢先发preview版的原因?NycVOGAV创新无限-科技改变未来,开启智能新时代vogav.com

o1突发内幕曝光?谷歌更早揭示原理 大模型光有软件不存在护城河NycVOGAV创新无限-科技改变未来,开启智能新时代vogav.com

o1突发内幕曝光?谷歌更早揭示原理,大模型光有软件不存在护城河NycVOGAV创新无限-科技改变未来,开启智能新时代vogav.com

有人由此感慨:NycVOGAV创新无限-科技改变未来,开启智能新时代vogav.com

确实正如谷歌自己所说的,没有人护城河,也永远不会有人有护城河。NycVOGAV创新无限-科技改变未来,开启智能新时代vogav.com

o1突发内幕曝光?谷歌更早揭示原理 大模型光有软件不存在护城河NycVOGAV创新无限-科技改变未来,开启智能新时代vogav.com

o1突发内幕曝光?谷歌更早揭示原理,大模型光有软件不存在护城河NycVOGAV创新无限-科技改变未来,开启智能新时代vogav.com

就在刚刚,OpenAI将o1-mini的速度提高7倍,每天都能使用50条;o1-preview则提到每周50条。NycVOGAV创新无限-科技改变未来,开启智能新时代vogav.com

o1突发内幕曝光?谷歌更早揭示原理 大模型光有软件不存在护城河NycVOGAV创新无限-科技改变未来,开启智能新时代vogav.com

o1突发内幕曝光?谷歌更早揭示原理,大模型光有软件不存在护城河NycVOGAV创新无限-科技改变未来,开启智能新时代vogav.com

计算量节省4倍NycVOGAV创新无限-科技改变未来,开启智能新时代vogav.com

谷歌DeepMind这篇论文的题目是:优化LLM测试时计算比扩大模型参数规模更高效。NycVOGAV创新无限-科技改变未来,开启智能新时代vogav.com

研究团队从人类的思考模式延伸,既然人面对复杂问题时会用更长时间思考改善决策,那么LLM是不是也能如此?NycVOGAV创新无限-科技改变未来,开启智能新时代vogav.com

换言之,面对一个复杂任务时,是否能让LLM更有效利用测试时的额外计算以提高准确性。NycVOGAV创新无限-科技改变未来,开启智能新时代vogav.com

此前一些研究已经论证,这个方向确实可行,不过效果比较有限。NycVOGAV创新无限-科技改变未来,开启智能新时代vogav.com

因此该研究想要探明,在使用比较少的额外推理计算时,就能能让模型性能提升多少?NycVOGAV创新无限-科技改变未来,开启智能新时代vogav.com

他们设计了一组实验,使用PaLM2-S*在MATH数据集上测试。NycVOGAV创新无限-科技改变未来,开启智能新时代vogav.com

主要分析了两种方法:NycVOGAV创新无限-科技改变未来,开启智能新时代vogav.com

(1)迭代自我修订:让模型多次尝试回答一个问题,在每次尝试后进行修订以得到更好的回答。NycVOGAV创新无限-科技改变未来,开启智能新时代vogav.com

(2)搜索:在这种方法中,模型生成多个候选答案。NycVOGAV创新无限-科技改变未来,开启智能新时代vogav.com

o1突发内幕曝光?谷歌更早揭示原理 大模型光有软件不存在护城河NycVOGAV创新无限-科技改变未来,开启智能新时代vogav.com

o1突发内幕曝光?谷歌更早揭示原理,大模型光有软件不存在护城河NycVOGAV创新无限-科技改变未来,开启智能新时代vogav.com

可以看到,使用自我修订方法时,随着测试时计算量增加,标准佳N策略(Best-of-N)与计算优扩展策略之间的差距逐渐扩大。NycVOGAV创新无限-科技改变未来,开启智能新时代vogav.com

使用搜索方法,计算优扩展策略在初期表现出比较明显优势。并在一定情况下,达到与佳N策略相同效果,计算量仅为其1/4。NycVOGAV创新无限-科技改变未来,开启智能新时代vogav.com

在与预训练计算相当的FLOPs匹配评估中,对比PaLM 2-S*(使用计算优策略)一个14倍大的预训练模型(不进行额外推理)。NycVOGAV创新无限-科技改变未来,开启智能新时代vogav.com

结果发现,使用自我修订方法时,当推理tokns远小于预训练tokens时,使用测试时计算策略的效果比预训练效果更好。但是当比率增加,或者在更难的问题上,还是预训练的效果更好。NycVOGAV创新无限-科技改变未来,开启智能新时代vogav.com

也就是说,在两种情况下,根据不同测试时计算扩展方法是否有效,关键在于提示的难度。NycVOGAV创新无限-科技改变未来,开启智能新时代vogav.com

研究还进一步比较不同的PRM搜索方法,结果显示前向搜索(右)需要更多的计算量。NycVOGAV创新无限-科技改变未来,开启智能新时代vogav.com

o1突发内幕曝光?谷歌更早揭示原理 大模型光有软件不存在护城河NycVOGAV创新无限-科技改变未来,开启智能新时代vogav.com

o1突发内幕曝光?谷歌更早揭示原理,大模型光有软件不存在护城河NycVOGAV创新无限-科技改变未来,开启智能新时代vogav.com

在计算量较少的情况下,使用计算优策略多可节省4倍资源。NycVOGAV创新无限-科技改变未来,开启智能新时代vogav.com

o1突发内幕曝光?谷歌更早揭示原理 大模型光有软件不存在护城河NycVOGAV创新无限-科技改变未来,开启智能新时代vogav.com

o1突发内幕曝光?谷歌更早揭示原理,大模型光有软件不存在护城河NycVOGAV创新无限-科技改变未来,开启智能新时代vogav.com

对比OpenAI的o1模型,这篇研究几乎是给出了相同的结论。NycVOGAV创新无限-科技改变未来,开启智能新时代vogav.com

o1模型学会完善自己的思维过程,尝试不同的策略,并认识到自己的错误。并且随着更多的强化学习(训练时计算)和更多的思考时间(测试时计算),o1 的性能持续提高。NycVOGAV创新无限-科技改变未来,开启智能新时代vogav.com

不过OpenAI更快一步发布了模型,而谷歌这边使用了PaLM2,在Gemini2上还没有更新的发布。NycVOGAV创新无限-科技改变未来,开启智能新时代vogav.com

网友:护城河只剩下硬件了?NycVOGAV创新无限-科技改变未来,开启智能新时代vogav.com

这样的新发现不免让人想到去年谷歌内部文件里提出的观点:NycVOGAV创新无限-科技改变未来,开启智能新时代vogav.com

我们没有护城河,OpenAI也没有。开源模型可以打败ChatGPT。NycVOGAV创新无限-科技改变未来,开启智能新时代vogav.com

如今来看,各家研究速度都很快,谁也不能确保自己始终领先。NycVOGAV创新无限-科技改变未来,开启智能新时代vogav.com

唯一的护城河,或许是硬件。NycVOGAV创新无限-科技改变未来,开启智能新时代vogav.com

o1突发内幕曝光?谷歌更早揭示原理 大模型光有软件不存在护城河NycVOGAV创新无限-科技改变未来,开启智能新时代vogav.com

o1突发内幕曝光?谷歌更早揭示原理,大模型光有软件不存在护城河NycVOGAV创新无限-科技改变未来,开启智能新时代vogav.com

(所以马斯克哐哐建算力中心?)NycVOGAV创新无限-科技改变未来,开启智能新时代vogav.com

有人表示,现在英伟达直接掌控谁能拥有更多算力。那么如果谷歌/微软开发出了效果更好的定制芯片,情况又会如何呢?NycVOGAV创新无限-科技改变未来,开启智能新时代vogav.com

o1突发内幕曝光?谷歌更早揭示原理 大模型光有软件不存在护城河NycVOGAV创新无限-科技改变未来,开启智能新时代vogav.com

o1突发内幕曝光?谷歌更早揭示原理,大模型光有软件不存在护城河NycVOGAV创新无限-科技改变未来,开启智能新时代vogav.com

值得一提的是,前段时间OpenAI首颗芯片曝光,将采用台积电先进的A16埃米级工艺,专为Sora视频应用打造。NycVOGAV创新无限-科技改变未来,开启智能新时代vogav.com

显然,大模型战场,只是卷模型本身已经不够了。NycVOGAV创新无限-科技改变未来,开启智能新时代vogav.com

参考链接:NycVOGAV创新无限-科技改变未来,开启智能新时代vogav.com

https://www.reddit.com/r/singularity/comments/1fhx8ny/deepmind_understands_strawberry_there_is_no_moat/NycVOGAV创新无限-科技改变未来,开启智能新时代vogav.com

本文链接:http://www.vogav.com/v4948.htmlo1突发内幕曝光?谷歌更早揭示原理 大模型光有软件不存在护城河

标签:
声明:本网页内容旨在传播知识,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。邮件:2376512515@qq.com。天上从来不会掉馅饼,请大家时刻谨防诈骗
相关文章
  • 如何在Word中自动生成目录

    目录是长篇文档中必不可少的部分,手动创建目录既费时又容易出错,而 Word 提供了自动生成目录的功能,可以根据文档中的标题自动创建目录。在使用 Word 撰写长篇文档时,自动生成

  • 动画设计师需要什么样的SSD固态硬盘

    在当代数字媒体行业,动画设计师扮演着重要的角色。他们通过创意和技术,将二维或三维图形转化为生动而吸引人的动画作品。然而,为了实现这一目标,动画设计师需要强大而高效的计

  • 99年高三老师哭得比学生还伤心 网友:这份真挚情感让人感动

    6月6日消息,据国内多家媒体报道,在高考前的后一堂课上,99年高三老师哭得比学生还伤心。她说,希望同学们毕业后朋友圈不要屏蔽我,三年见证你们的成长,以后也

  • 编程课主要学什么

    编程课程作为踏入信息技术世界的敲门砖,不仅教会学生编写代码,更重要的是培养逻辑思维、问题解决能力和创新意识。不同层次和方向的编程课程内容有所差异,但大体上涵盖以下几

  • Win11录屏按快捷键没反应怎么办

    Win11 提供了一个便捷的内置录屏功能,通常可以通过快捷键 Windows + Alt + R 启动。有时候你会发现这个快捷键没有任何反应,本文将提供一些常见的故障排除步骤,帮助你解决这个

  • M.2 SATA接口可以插NVMe的固态么

    M.2 接口的固态硬盘因小巧身形与高速传输能力,成为了众多电脑升级者的首选,但在选择 M.2 固态硬盘时,用户常面临一个疑惑:M.2 SATA 接口究竟能否直接兼容并使用速度更快的 NVM

热门阅读
SQL Error: select * from ***_ecms_news4 where id in() limit 2
热门话题
SQL Error: select * from ***_ecms_news5 where id in() limit 10