OpenAI新模型或为数学解题“高手”

据法国《回声报》网站9月12日报道，“o1”会成为一个好学生，甚至是老师们的宠儿。美国开放人工智能研究中心(OpenAI)在线上发布的一份声明中指出，在美国中学生参加的一场数学竞赛中，聊天生成预训练转换器(ChatGPT)的创造者推出的全新人工智能模型位列“前500名”。

OpenAI保证说，“o1会在回答之前先思考”，“在响应用户之前，它可以产生一个很长的内部思维链”。该公司由此正在朝着自己设定的目标前进，即开发“通用”人工智能，也就是与人类智能类似的人工智能。

OpenAI强调，企业在解决数学问题等方面对其进行了测试，“在许多需要强大推理能力的基准测试中，o1的表现可与人类专家相媲美”。

另据美国《纽约时报》网站9月12日报道，OpenAI的ChatGPT和谷歌的“双子座”人工智能模型(Gemini)等在线聊天机器人有时会在处理简单的数学问题时遇到困难。它们生成的计算机代码往往漏洞百出，而且不完整。有时，它们甚至会胡编乱造。

12日，OpenAI推出了新版ChatGPT，可以减少这些缺陷。该公司表示，这款聊天机器人采用了名为OpenAI o1的人工智能新技术，可以“推理”完成涉及数学、编码和科学的任务。

OpenAI首席科学家雅各布·帕霍茨基说：“像ChatGPT这样以前的模型，你问它们一个问题，它们就会立即开始回答。这个新模型可以慢慢来。它可以用英语思考问题，并试着分解问题，寻找角度，努力提供最佳答案。”

随着ChatGPT在2022年底首次亮相，OpenAI向人们展示了机器可以像人一样处理任务。

ChatGPT通过分析从互联网上搜集的大量文本来学习技能。

由于互联网上充斥着不实信息，这项技术学会了重复同样的不实信息。有时，它还会胡编乱造。

帕霍茨基及其同事试图减少这些缺陷。他们利用所谓的“强化学习”构建了OpenAI的新系统。在这一(可能持续数周或数月的)过程中，系统可以通过大量的试验和错误来学习行为。

例如，通过解决各种数学问题，它可以学习哪些方法能得到正确答案，哪些不能。如果在大量问题中重复这一过程，它就能找出规律。但这个系统不一定能像人类一样推理。它仍可能犯错和产生幻觉。

OpenAI表示，新技术在某些标准化测试中的表现优于之前的技术。在国际数学奥林匹克——面向高中生的顶级数学竞赛——的资格考试中，OpenAI以前的模型得分率为13%，而OpenAI o1的得分率为83%。（编译/刘白云、刘卓）

二级分类：