OpenAI o1:更强的推理能力
这是一系列全新的推理模型,旨在帮助解决复杂问题。这些模型经过特别训练,可以在作出回应之前,花更多时间进行思考,能够在科学、编码和数学等领域解决比以往更具挑战性的问题,OpenAI o1将先在 ChatGPT 和 API 上推出。
新模型是怎么运作的呢?官方介绍,它们经过专门的训练,学习如何像人类一样思考问题,尝试不同的解决策略,并及时识别错误。
研究人员在测试中发现,下一代模型的表现与博士生在物理、化学和生物学等高难度任务上的表现相当,尤其在数学和编码领域更是表现出色。例如,在国际数学奥林匹克的资格考试中,传统模型 GPT-4o 只正确解决了13% 的问题,而新的推理模型却达到了83%。在编码能力方面,它们在 Codeforces 竞赛中也取得了第 89 百分位好成绩。
不过,值得注意的是,作为早期模型,o1-preview 还缺乏一些让 ChatGPT 实用的功能,比如网络浏览和文件上传等。但在处理复杂推理任务时,这确实是一个巨大的进步。为了配合新模型的能力,研究人员还加强了安全措施,确保它们遵循安全和对齐准则。
这些增强的推理能力特别适合那些在科学、编码、数学等领域解决复杂问题的用户,比如医疗研究人员、物理学家和开发者等。
OpenAI o1-mini
OpenAI还推出了一个更小的模型 ——OpenAI o1-mini,它在代码生成和调试方面表现优秀,且成本更低,适合需要推理但不需要广泛知识的应用。
作为较小的模型,o1-mini 比 o1-preview 便宜80%,使其成为一个功能强大、经济高效的模型,适用于需要推理但不需要广泛世界知识的应用程序。
如何使用OpenAI o1
从今天开始,ChatGPT Plus 和 Team 用户可以在模型选择中找到 o1-preview 和 o1-mini 两个选项。
接下来,ChatGPT Enterprise 和 Edu 用户也将获得这两个模型的访问权限。而对于开发者来说,符合 API 使用条件的用户已经可以开始使用这两个模型进行原型开发了。
未来,官方将不断更新这些推理模型,添加更多实用功能,包括浏览和文件上传等,确保能为用户提供更好的体验。
不过,要想充分使用这个新模型,用户需要调整他们的提示方式,因为 OpenAI o1 的工作方式和 GPT-4乃至 GPT-4o 有很大的不同。
根据 OpenAI 的 API 文档,OpenAI o1 模型更喜欢简单直接的提示。
提示工程设计,简化模型引导
也就是说,用户不需要像以往那样给出复杂的指导或长篇的上下文。以前的模型需要更多的引导,用户常常利用更长的上下文窗口来帮助模型理解任务,但OpenAI o1 已经具备了更强的内部推理能力,因此不再需要这些冗长的说明。
OpenAI 还提醒用户在使用 o1模型时,需要注意以下几点:
– 提示要保持简单、直接,不要过多指导,因为这个模型能够很好地理解指令。
– 避免使用 “思路链” 提示,因为 o1模型本身已经能够进行内部推理。
– 使用分隔符,比如三重引号、XML 标签和章节标题,这样模型可以更清楚地知道自己正在解析哪个部分。
– 限制额外的上下文信息,特别是在进行增强检索生成(RAG)任务时,因为添加过多的背景资料可能会使模型的回答变得复杂。
这与 OpenAI 之前对用户的建议截然不同。以前,OpenAI 建议用户要非常具体,包括详细信息并逐步指导模型,但现在的OpenAI o1 则更能自主思考,找到解决问题的方法。
在 Penn 大学沃顿商学院教授 Ethan Mollick 的博客中,他提到作为早期用户,他发现OpenAI o1 在需要规划的任务中表现得更为出色,能够自主得出解决方案。
当然,提示工程也变得越来越重要,这不仅成为一种重要技能,还是一个新兴的职业类别。为此,其他 AI 开发者也推出了便于用户设计提示的工具,比如谷歌推出的 Prompt Poet,它通过集成外部数据源,使得响应更加相关。
由于OpenAI o1 的不同,用户仍在弄清楚如何使用它。然而,一些社交媒体用户预测,人们将不得不改变他们提示 ChatGPT 的方式。
尽管 OpenAI o1还很新,大家仍在摸索如何使用它,但社交媒体上的一些用户已经预测,大家需要重新思考与 ChatGPT 的互动方式。