工作笔记

二级分类:

OpenAI新模型或为数学解题“高手”

据法国《回声报》网站9月12日报道,“o1”会成为一个好学生,甚至是老师们的宠儿。美国开放人工智能研究中心(OpenAI)在线上发布的一份声明中指出,在美国中学生参加的一场数学竞赛中,聊天生成预训练转换器(ChatGPT)的创造者推出的全新人工智能模型位列“前500名”。

OpenAI保证说,“o1会在回答之前先思考”,“在响应用户之前,它可以产生一个很长的内部思维链”。该公司由此正在朝着自己设定的目标前进,即开发“通用”人工智能,也就是与人类智能类似的人工智能。

OpenAI强调,企业在解决数学问题等方面对其进行了测试,“在许多需要强大推理能力的基准测试中,o1的表现可与人类专家相媲美”。

另据美国《纽约时报》网站9月12日报道,OpenAI的ChatGPT和谷歌的“双子座”人工智能模型(Gemini)等在线聊天机器人有时会在处理简单的数学问题时遇到困难。它们生成的计算机代码往往漏洞百出,而且不完整。有时,它们甚至会胡编乱造。

12日,OpenAI推出了新版ChatGPT,可以减少这些缺陷。该公司表示,这款聊天机器人采用了名为OpenAI o1的人工智能新技术,可以“推理”完成涉及数学、编码和科学的任务。

OpenAI首席科学家雅各布·帕霍茨基说:“像ChatGPT这样以前的模型,你问它们一个问题,它们就会立即开始回答。这个新模型可以慢慢来。它可以用英语思考问题,并试着分解问题,寻找角度,努力提供最佳答案。”

随着ChatGPT在2022年底首次亮相,OpenAI向人们展示了机器可以像人一样处理任务。

ChatGPT通过分析从互联网上搜集的大量文本来学习技能。

由于互联网上充斥着不实信息,这项技术学会了重复同样的不实信息。有时,它还会胡编乱造。

帕霍茨基及其同事试图减少这些缺陷。他们利用所谓的“强化学习”构建了OpenAI的新系统。在这一(可能持续数周或数月的)过程中,系统可以通过大量的试验和错误来学习行为。

例如,通过解决各种数学问题,它可以学习哪些方法能得到正确答案,哪些不能。如果在大量问题中重复这一过程,它就能找出规律。但这个系统不一定能像人类一样推理。它仍可能犯错和产生幻觉。

OpenAI表示,新技术在某些标准化测试中的表现优于之前的技术。在国际数学奥林匹克——面向高中生的顶级数学竞赛——的资格考试中,OpenAI以前的模型得分率为13%,而OpenAI o1的得分率为83%。(编译/刘白云、刘卓)