OpenAI公布最新具思考能力的旗舰模型o3

AI新闻

OpenAI首席执行官Sam Altman亲自宣布具思考能力的旗舰模型进入最新版o3时代。

令人意外的是，9月问世的关联思考模型o1，并没有o2版。The Information报道，这可能是因为若叫o2会和英国电信企业o2撞名，迫使OpenAI直接升级为o3。

OpenAI同时宣布o3 mini。它是由o3蒸馏而成的小模型，并为程序撰写优化速度。OpenAI计划2025年初陆续部署o3系列模型，包括开放公测。o3 mini将是第一个问世的o3模型，预计2025年初公开使用。目前该公司已开始OpenAI o3的安全测试及红队演练，OpenAI邀请安全研究人员申请加入早期版测试。

OpenAI展示，o3在包括程序撰写、数学解题，以及科学理解等基准测试都比前代更进一步。其中在ARC AGI测试中，o3系列在低运算量任务的测试得分达75.7%，高运算量任务得分达87.5%，都超越o1系列。

OpenAI说明，o3技术提升的关键之一是deliberative alignment（审慎遵循）。这是一种以人为撰写的文本及可解读的安全规格教导o系列LLM，并训练他们在回答用户查询前先清楚理解这些规格。研究人员的新训练方法让o系列模型使用思维链（chain-of-thought，CoT）推理方法来思考用户提示、从OpenAI内部政策识别出相关文本，再草拟出更安全的回应。这新训练方法让模型得以准确遵循OpenAI的安全策略而无需人类标签过的CoT或答案。

OpenAI说前一代的o1在此类训练下，在多项内、外部安全基准测试中已经大幅超越GPT-4o和其他尖端LLM，且在多种数据集也展现高性能。OpenAI相信这种新方法，可同时用于提升LLM能力以及AI安全性。

为了迎战新的OpenAI o3模型，Google已在本周稍早公布Gemini 2.0 Flash Thinking实验模型，供开发人员测试。新模型将能混合图文、产生多种情感的声音，还能使用搜索及程序，可更完美控制代理人。

声明：本站资源来自会员发布以及互联网公开收集，不代表本站立场，仅限学习交流使用，请遵循相关法律法规，请在下载后24小时内删除。如有侵权争议、不妥之处请联系本站删除处理！请用户仔细辨认内容的真实性，避免上当受骗！

OpenAI公布最新具思考能力的旗舰模型o3

相关文章

阶跃星辰视频生成模型Step-Video V2版发布支持精准生成基础文字

阶跃星辰视频生成模型Step-Video V2版发布支持精准生成基础文字

AI新闻 16 小时前 3

字节加码AGI：豆包大模型组建“Seed Edge”团队，探索AI未来

字节加码AGI：豆包大模型组建“Seed Edge”团队，探索AI未来

AI新闻 17 小时前 3

谷歌 Gemini AI 助手大升级：可分析图片、控制多款应用！

谷歌 Gemini AI 助手大升级：可分析图片、控制多款应用！

AI新闻 17 小时前 1

AI 赋能供应链，从价值创造到未来引领

AI 赋能供应链，从价值创造到未来引领

AI新闻 17 小时前 1

AI应用大放异彩！全球手机用户花费超10亿，ChatGPT引领潮流

AI应用大放异彩！全球手机用户花费超10亿，ChatGPT引领潮流

AI新闻 17 小时前 1

Perplexity推出Sonar API:AI搜索引擎开放企业级接入

Perplexity推出Sonar API:AI搜索引擎开放企业级接入

AI新闻 2 天前 3

商汤“秒画趣拍”APP正式上线支持AI写真、视频、滤镜等功能

商汤“秒画趣拍”APP正式上线支持AI写真、视频、滤镜等功能

AI新闻 2 天前 1

字节跳动发布豆包大模型1.5Pro，性能超越GPT-4o与Claude3.5Sonnet

字节跳动发布豆包大模型1.5Pro，性能超越GPT-4o与Claude3.5Sonnet

AI新闻 2 天前 3