谷歌DeepMind AI系统展现超强几何解题能力
佚名
2025-02-09 09:00:42
0

IT之家 2 月 8 日消息,谷歌旗下人工智能研究实验室 DeepMind 开发的人工智能系统 AlphaGeometry2 在解决国际数学奥林匹克竞赛(IMO)几何问题方面取得了突破性进展,其表现甚至超过了平均金牌得主。

二重积分几何意义解题_联想能力超强的人_

AlphaGeometry2 是 DeepMind 在今年 1 月发布的 AlphaGeometry 系统的改进版本。根据 DeepMind 研究人员最新发表的论文,该 AI 系统能够解决过去 25 年国际数学奥林匹克竞赛中 84% 的几何问题。国际数学奥林匹克竞赛是一项面向高中生的数学竞赛,而 DeepMind 认为,发现解决复杂几何问题(特别是欧几里得几何问题)的新方法可能是实现更强大人工智能的关键。

二重积分几何意义解题__联想能力超强的人

证明数学定理或逻辑解释定理(例如勾股定理)为何成立,需要推理能力以及从多种可能的步骤中选择解决方案的能力。如果 DeepMind 的观点正确,这些解决问题的技能将成为未来通用人工智能模型的重要组成部分。

IT之家注意到,去年夏天,DeepMind 展示了一个将 AlphaGeometry2 与 AlphaProof(一种用于形式化数学推理的 AI 模型)相结合的系统,成功解决了 2024 年国际数学奥林匹克竞赛中的 6 个问题中的 4 个。除了几何问题,类似的方法还可以扩展到数学和科学的其他领域,例如辅助复杂的工程计算。

AlphaGeometry2 包含几个核心要素,其中包括谷歌 Gemini 系列 AI 模型中的语言模型和一个“符号引擎”。Gemini 模型协助符号引擎,后者利用数学规则推导问题的解决方案,并为给定的几何定理提供可行的证明。

由于将证明转化为 AI 可理解的格式存在复杂性,可用的几何训练数据匮乏。因此,DeepMind 为 AlphaGeometry2 的语言模型创建了自己的合成数据,生成了超过 3 亿个不同复杂度的定理和证明。

研究团队从过去 25 年(2000 年至 2024 年)的国际数学奥林匹克竞赛中挑选了 45 个几何问题,包括线性方程和需要在平面上移动几何对象的方程,并将其“翻译”成一个更大的 50 个问题的集合(由于技术原因,某些问题需要拆分为两个)。根据论文,AlphaGeometry2 解决了其中的 42 个问题,超过了平均金牌得主 40.9 的得分。

不过,该系统也存在局限性。一个技术问题导致 AlphaGeometry2 无法解决涉及可变数量点、非线性方程和不等式的问题。此外,尽管 AlphaGeometry2 不是第一个达到几何问题金牌水平表现的 AI 系统,但它是在如此规模的问题集上实现这一目标的首个系统。

在另一组更具挑战性的国际数学奥林匹克竞赛问题上,AlphaGeometry2 的表现也不尽如人意。DeepMind 团队额外挑选了 29 个由数学专家为竞赛提名但尚未出现在比赛中的问题,AlphaGeometry2 只能解决其中的 20 个。

相关内容

2026上海环保展有啥亮点...
人工智能技术  开启环保新方向慕尼黑博览集团于1966年创立IFA...
2025-12-22 19:34:17
天津广告印刷办公展、新疆展...
信息展会推荐榜在当今数字化时代,信息展会是获取行业动态和前沿技术的...
2025-12-22 19:08:30
展会宣传用短视频?这些专业...
在当今数字化时代,短视频已成为企业宣传和推广的重要工具。尤其是在展...
2025-12-20 19:08:42
2026年德国展会Faku...
Fakuma是全球最重要的塑料加工专业贸易博览会之一,被誉为“塑料...
2025-12-19 19:56:37
2025年中国会展业年会在...
会展BEN 2025年12月18日 08:15 北京本文转自“智海...
2025-12-19 19:08:50
十五五开局,中国会展业迈向...
“十五五”开局之际,中国会展业正站在从“展览大国”迈向“展览强国”...
2025-12-18 23:15:28

热门资讯

3000+人次到场,大量行业首... 3000+人次到场,大量行业首发内容,2024甲子引力年终盛典成功举办丨甲子引力,机器人,人工智能,...
用OLED怕烧屏,华为新专利“... 新款 iPad Pro 克服了此前传统 OLED 屏幕的亮度问题,在平板电脑的尺寸下做到了 1000...
华米 Ov 们把手机电池搞得大... 话说,今年的国产旗舰手机,有一个特质很突出 —— 电池容量大。除了少数几款标准版机型,大多新机的电池...
雷蛇推出USB 4拓展坞:10... 这款拓展坞采用铝合金外壳,似乎不支持RGB灯效。
英国首相为“AI 校园”揭幕:... IT之家 11 月 28 日消息,据路透社报道,当地时间 27 日,英国首相基尔・斯塔默(Keir ...
生成式人工智能安全大赛完美收官... 生成式人工智能安全大赛完美收官 院士专家共谈AI安全与治理
一文看懂索尼、三星、豪威的各种... 1,三大厂家名词统一首先,“双原生ISO”这个词最先在手机端出现,还得追溯至绿厂 Find X2 P...
刚刚,OpenAI首个智能体提... 刚刚,OpenAI首个智能体提前曝光!高级编码AI剑指400万年薪L6级工程师,编程,工程师,智能体...
靠七天无理由退货赚了200万?... 漏洞不是随便钻的。
对标DeepSeek的深度思考... 对标DeepSeek的深度思考模式?OpenAI推出新功能Deep research,大模型,dee...