o3压台登场:OpenAI卷动推理AI模型风云,迈向AGI新巅峰
佚名
2024-12-21 23:01:34
0

IT之家 12 月 21 日消息,“12 Days of OpenAI”活动已拉上帷幕,OpenAI 的 o3 系列大模型压台登场,官方称在某些场景下,其推理能力非常接近通用人工智能(AGI)。

名称

最新的 AI 模型为何跳过 o2,叫做 o3 呢?OpenAI 公司首席执行官山姆・阿尔特曼(Sam Altman)在今天早上的直播活动,表示是为了规避和英国电信运营商 O2 的商标冲突。

邀请安全测试

o3 是 o1 推理模型的继任者,包含完整版和精简版(o3-mini),后者主要针对特定任务进行了微调。

OpenAI 公司暂未完全开放 o3 和 o3-mini 两款模型,即日起先邀请安全研究人员,注册测试预览版 o3-mini 模型,后续再推出 o3 预览版。

小说风云巅峰_风云之巅是什么意思_

小说风云巅峰__风云之巅是什么意思

现在,感兴趣的朋友可以提交申请:。

阿尔特曼并未公布 o3 模型的具体开放日期,仅透露 2025 年 1 月底推出 o3-mini,后续再推出 o3。

o3 模型推理

OpenAI o3 模型和主流 AI 模型的一个最大不同点,在于会展开事实核查,从而可以规避一些常见的模型陷阱,但这个过程会产生响应延迟,根据推理难度,通常是几秒到几分钟。

o3 系列模型的另一个亮点是使用“私人思想链”(private chain of thought)进行“思考”,它可以在响应前暂停,考虑相关提示并解释其推理过程,最终总结出最准确的答案。

o3 的新功能之一是可以调整推理时间,分为低、中、高三种计算级别,计算级别越高,o3 的任务执行性能越好。

性能和 AGI

AGI 的全称是 artificial general intelligence,直译过来就是通用人工智能,泛指 AI 可以像人类一样执行任何任务,OpenAI 公司官方定义为“在最具经济价值的工作中超越人类的高度自治系统”。

OpenAI 公司正积极朝 AGI 目标迈进,除了巩固其在 AI 领域的地位之外,还在投资领域有特别的含义。

根据 OpenAI 与密切合作伙伴和投资者微软的交易条款,一旦 OpenAI 达到 AGI,公司就不再有义务向微软提供其最先进的技术(即符合 OpenAI 的 AGI 定义的技术)。

而 o3 是 OpenAI 是迈向该目标的重要一步,在 ARC-AGI 基准测试中,o3 在高计算设置下获得了 87.5% 的分数,在低计算设置下得分为 75.7%,性能是 o1 的三倍。

ARC-AGI 联合创始人 François Chollet 表示,诚然高计算设置非常昂贵,每个任务要花费数千美元。

小说风云巅峰_风云之巅是什么意思_

_风云之巅是什么意思_小说风云巅峰

IT之家援引该媒体报道,在其他基准测试中,o3 表现出色:

风云之巅是什么意思_小说风云巅峰_

小说风云巅峰__风云之巅是什么意思

_风云之巅是什么意思_小说风云巅峰

这些结果来自 OpenAI 的内部评估,需要等待外部客户和机构的基准测试结果来进一步验证。

安全

o3 的发布标志着 OpenAI 在通用人工智能领域迈出了重要一步。虽然 o3 的能力令人印象深刻,但其潜在风险也需要引起重视。OpenAI 承诺将致力于模型安全,并与其他机构合作构建更完善的基准测试体系。

相关内容

2026上海环保展有啥亮点...
人工智能技术  开启环保新方向慕尼黑博览集团于1966年创立IFA...
2025-12-22 19:34:17
天津广告印刷办公展、新疆展...
信息展会推荐榜在当今数字化时代,信息展会是获取行业动态和前沿技术的...
2025-12-22 19:08:30
展会宣传用短视频?这些专业...
在当今数字化时代,短视频已成为企业宣传和推广的重要工具。尤其是在展...
2025-12-20 19:08:42
2026年德国展会Faku...
Fakuma是全球最重要的塑料加工专业贸易博览会之一,被誉为“塑料...
2025-12-19 19:56:37
2025年中国会展业年会在...
会展BEN 2025年12月18日 08:15 北京本文转自“智海...
2025-12-19 19:08:50
十五五开局,中国会展业迈向...
“十五五”开局之际,中国会展业正站在从“展览大国”迈向“展览强国”...
2025-12-18 23:15:28

热门资讯

3000+人次到场,大量行业首... 3000+人次到场,大量行业首发内容,2024甲子引力年终盛典成功举办丨甲子引力,机器人,人工智能,...
用OLED怕烧屏,华为新专利“... 新款 iPad Pro 克服了此前传统 OLED 屏幕的亮度问题,在平板电脑的尺寸下做到了 1000...
华米 Ov 们把手机电池搞得大... 话说,今年的国产旗舰手机,有一个特质很突出 —— 电池容量大。除了少数几款标准版机型,大多新机的电池...
雷蛇推出USB 4拓展坞:10... 这款拓展坞采用铝合金外壳,似乎不支持RGB灯效。
英国首相为“AI 校园”揭幕:... IT之家 11 月 28 日消息,据路透社报道,当地时间 27 日,英国首相基尔・斯塔默(Keir ...
生成式人工智能安全大赛完美收官... 生成式人工智能安全大赛完美收官 院士专家共谈AI安全与治理
一文看懂索尼、三星、豪威的各种... 1,三大厂家名词统一首先,“双原生ISO”这个词最先在手机端出现,还得追溯至绿厂 Find X2 P...
刚刚,OpenAI首个智能体提... 刚刚,OpenAI首个智能体提前曝光!高级编码AI剑指400万年薪L6级工程师,编程,工程师,智能体...
靠七天无理由退货赚了200万?... 漏洞不是随便钻的。
对标DeepSeek的深度思考... 对标DeepSeek的深度思考模式?OpenAI推出新功能Deep research,大模型,dee...