OpenAI发布新模型o1,物理生物化学问题超过博士水平
OpenAI 于 2024 年 9 月 12 日晚间正式对外发布了一款名为 o1 的新模型(o1-preview 和 o1-mini)。该模型最初的代号为“Q*”,也曾被传为“Strawberry”。在训练 o1 模型中,OpenAI 使用了一种称为强化学习(reinforcement learning)的技术,让模型自行解决问题,通过奖励和惩罚来教导系统。随后 o1 采用“思维链”来处理查询,类似于人类通过逐步推理来解决问题的方式。
OpenAI o1 模型特点
o1 模型具有以下显著特点:
- 强大的推理能力:在解决复杂问题方面表现出色,尤其在科学、编程和数学领域。例如,在 2024 年的 AIME 数学考试中,GPT-4o 平均只解决了 12%的题目,而 o1 模型单次测试的平均解题率达到了 74%,如果算上 64 次测试的平均得分,能达到 83%;重新从 1000 个样本中排名,平均得分甚至可以达到 93%。
- 模仿人类慢思考:o1 模型在回答前会反复思考、拆解、理解和推理,然后给出最终答案,具有人类慢思考特质。
- 版本差异:分为 o1-preview 和 o1-mini 两个版本。o1 mini 版在速度、体积和成本方面做了优化,适合处理数学、编程推理等需要快速处理的任务;o1-preview 版则更擅长解决复杂的问题,推理能力更强。
OpenAI o1 应用场景
o1 模型具有广泛的应用场景:
- 科学研究:医疗研究人员可以用 o1 来标注细胞测序数据。
- 物理学:物理学家可以用它生成量子光学所需的复杂数学公式。
- 软件开发:各个领域的开发人员可以用 o1 来构建和执行多步骤工作流。
- 数学领域:帮助解决复杂的数学问题和竞赛题目。 然而,o1 模型在日常生活中的应用相对欠缺灵活性,例如在处理消费电子产品优惠计算等实际生活问题时表现不够理想。
OpenAI o1 发布的影响
OpenAI 新模型 o1 的发布具有重大意义:
- 行业突破:标志着人工智能在复杂推理任务上的重要进展,代表了人工智能能力的新水平。
- 推动发展:为人工智能行业的发展注入了强大动力,可能促使其他公司加大研发投入,推动技术进步。
- 应用拓展:使得 o1 在医疗、物理、数学等领域的应用更加广泛和深入,为相关领域的研究和工作带来便利。
- 引发思考:让人们对人工智能的未来发展有了更多的期待和思考,例如模型的思考时长和未来可能达到的成就。
与 GPT-4o 相比,o1-preview 在需要大量推理的任务上,如数据分析、编程和数学问题,表现更优,推理能力更强、更高效。但在自然语言处理任务上,o1-preview 的表现不如 GPT-4o,因为其训练重点在推理和解决问题的策略上,而不是在语言的流畅度或文本生成的多样性上。
如何使用 OpenAI o1
由于 OpenAI o1 模型不对免费用户开放,加上国内用户开通 ChatGPT Plus 订阅限制国内信用卡渠道,所以需要借助WildCard 虚拟卡来开通 ChatGPT Plus 才能使用,同样如果想要使用 OpenAI API 接口调用,也需要结果虚拟卡进行充值才能使用,同时还需要 API 消费等级达到 5 才行,所以普通用户最简单的就是直接开通 ChatGPT Plus 就能用上最新的 OpenAI o1 大数据模型。
WildCard 虚拟卡官网:leixue.com/go/wildcard (通过链接或邀请码“LEIXUE”有开卡优惠)
相关教程推荐:WildCard 开卡教程、ChatGPT Plus 订阅教程、OpenAI API 使用教程
本文链接:http://www.vogav.com/v11330.htmlOpenAI发布新模型o1,物理生物化学问题超过博士水平
-
字节跳动发布豆包大模型
字节跳动在 2024 年 5 月 15 日的火山引擎原动力大会上正式发布了豆包大模型。这款大模型经过一年时间的迭代和市场验证,已经成为国内使用量最大、应用场景最丰富的大模型之
-
美团发布2024年一季度财报:营收733亿元同比增长25% 佣金207亿元同比增长27.2%
6月6日消息,美团发布2024年第一季度业绩报告。财报显示,一季度美团营收733亿元,同比增长25%。经调整净利润为74.88亿元,同比增长36.4%。根据财报,该季度,美
-
胖东来董事长于东来自曝患胃癌:提醒年轻人爱惜身体
6月6日消息,据国内多家媒体报道,近日,胖东来商贸集团董事长于东来在直播间透露自己已经是胃癌前期,身体的每个器官都不好,医生说明年或者后年就必须要做手
-
小米蓝牙音箱 Mini “浅咖色”首销,到手价 199 元
6 月 1
-
飞猫 5G 随身WiFi U2O 开售
6 月 7
-
努比亚红魔 1S 机械键盘开启预售
6 月 1