热门资讯

OpenAI最强推理模型o3发布：AGI能力暴涨接近人类水平

业界来源：快科技 2024-12-21 11:30:50

OpenAI“连续12日圣诞发布”终于迎来激动人心的大结局，OpenAI推出重磅收官新品，其迄今最强前沿推理模型的升级版——o3。

OpenAI号称o3在一些条件下接近通用人工智能（AGI），共有o3和精简版o3-mini两个版本。

评估显示，o3在软件工程测试中准确率比o1高近47%，竞赛数学测评的准确率比o1高15%，人类博士专家级生化物测试中准确率比o1高近13%。

AGI相关测试中，o3最佳成绩87.5，超过人类水平门槛85，显示迈向类人智能取得突破。

对比之下，GPT-3的评测结果为0%，GPT-4o为5%，而o3一举将成绩提升到87.5%。

OpenAI计划明年初发布o3系列模型，CEO Altman暗示可能一段时间内都不会面向大众上线这类模型，称希望正式发布前，先有一个联邦政府的测试框架，指导监控并减少这类模型的风险。

从本周五开始，OpenAI允许安全研究人员可以注册访问o3 和 o3-mini的预览。

OpenAI12天技术直播要点汇总：

1、推出“满血版”推理模型o1和ChatGPT Pro（每月订阅费200美元）。

2、推出强化微调研究项目，能够使用数十到数千个高质量任务定制模型。

3、正式推出AI视频生成模型Sora Turbo，最高支持1080p 20s视频。

4、发布升级版Canvas创作助手，主打高效编程与写作，向全量用户开放。

5、与苹果合作发布iOS 18.2，Siri、写作工具和Visual Intelligence与ChatGPT深度集成

6、全量上线4o视频通话，能实时对话并理解用户的连续性动作，也有记忆。

7、推出Projects In ChatGPT，可整合ChatGPT的各种功能，便于创建及管理项目。

8、ChatGPT搜索功能全面升级，新增地图集成、实时搜索等功能，向所有用户开放。

9、OpenAI开放满血o1模型API，实时API直接支持WebRTC，且定价猛砍60%。

10、ChatGPT入驻手机，拨打免费号码连接聊天机器人，每月可免费通话15分钟。

11、支持原生应用程序自动化协作功能，与AI Agent玩法相似，能够主动理解用户需求。

12、o1下一代模型o3亮相，推出两个版本，正式版o3以及精简版o3-mini。

延伸阅读

GPT-5.2-Codex – OpenAI推出的智能体编程模型

GPT-5.2-Codex是什么GPT-5.2-Codex 是 OpenAI 推出的智能体编程模型，专为复杂软件工程和防御性网络安全设计。模型是 GPT-5.2 的升级版，提升了指令遵循、长语境理解等
MiniMax冲击港股阿里米哈游腾讯加持

央广网报道，通用人工智能公司MiniMax（稀宇科技）今日已通过港交所上市聆讯，有望成为从成立到完成IPO历时最短的AI企业。据悉，截至2025年9月30日，MiniMax持有现金结余10.46亿美元
年仅27岁出任腾讯AI首席科学家：高考数学睡觉错失全省第一

据媒体报道，近日，年仅27岁的姚顺雨出任腾讯AI首席科学家。腾讯升级大模型研发架构，新成立AI Infra部、AI Data部、数据计算平台部，全面强化其大模型的研发体系与核心能力。而姚顺雨出任“CE

关注公众号：拾黑（shiheibook）了解更多

友情链接：

关注数据与安全，洞悉企业级服务市场：https://www.ijiandao.com/
安全、绿色软件下载就上极速下载站：https://www.yaorank.com/

*文章为作者独立观点，不代表牛品汇立场

本文由逗比来打小怪兽发表，转载此文章须经作者同意，并请附上出处( 牛品汇 )及本页链接。

原文链接 https://www.niupinhui.com/net/it/15252.html

OpenAI AGI o3-mini

图库

猜你喜欢

公众号

关注网络尖刀微信公众号
随时掌握互联网精彩

赞助链接