AlphaGeometry2：DeepMind突破性AI，挑战国际数学奥林匹克-AITOP100,AI资讯

DeepMind AlphaGeometry2：AI 几何解题新突破

谷歌 DeepMind 研究实验室推出最新 AI 系统 AlphaGeometry2，其在解决几何问题方面的卓越表现，已经超越国际数学奥林匹克（IMO）比赛中的平均金牌得主水平。这个系统是 AlphaGeometry 的升级版本，研究人员表示，AlphaGeometry2 有能力解决过去 25 年 IMO 中 84% 的几何难题。

为何 DeepMind 关注高中数学竞赛？

DeepMind 认为，探索解决复杂几何问题的新途径，特别是欧几里得几何，对于提升 AI 的推理能力至关重要。证明数学定理，例如解释勾股定理的原理，需要逻辑推理和选择多个步骤的能力。DeepMind 认为，这些问题解决能力对未来通用 AI 模型的构建具有重要意义。

AlphaGeometry2与AlphaProof：数学推理的强强联合

今年夏天，DeepMind 展示了结合 AlphaGeometry2 与数学推理 AI 模型 AlphaProof 的系统，该系统在 2024 年 IMO 的六个问题中成功解决了四个。这种方法不仅限于几何问题，还可以扩展到其他数学和科学领域，例如复杂的工程计算。

AlphaGeometry2 的核心技术

AlphaGeometry2 的核心构成包括谷歌 Gemini 系列的语言模型和一个“符号引擎”。Gemini 模型协助符号引擎通过数学规则推导出问题的可行解。IMO 几何问题通常基于需要添加“构造”的图形，如点、线或圆。AlphaGeometry2 的 Gemini 模型能够预测哪些构造可能有助于解决问题。

训练数据与性能

值得关注的是，AlphaGeometry2 在解决 IMO 问题时，使用了 DeepMind 自己生成的超过 3 亿个定理和证明的合成数据进行训练。研究团队选择了过去 25 年中 IMO 的 45 个几何问题，并进行了扩展，形成包含 50 个问题的集合。AlphaGeometry2 成功解决了其中的 42 个，超越了金牌得主的平均水平。

AlphaGeometry2 的局限性与未来展望

AlphaGeometry2 仍存在一些局限，比如无法处理具有可变数量点、非线性方程和不等式的问题。尽管如此，这项研究引发了关于 AI 系统应该基于符号操作还是神经网络的讨论。AlphaGeometry2 采取了一种混合方法，融合了神经网络和基于规则的符号引擎。

AlphaGeometry2 的成功为通用 AI 的未来发展提供了新的思路。虽然目前还未完全实现自给自足，但 DeepMind 团队的研究预示着未来可能会涌现出更多自足的 AI 模型。

论文入口:https://arxiv.org/pdf/2502.03544

更多AI行业最新资讯新闻信息请关注AI 人工智能网站--AITOP100平台--AI资讯专区：https://www.aitop100.cn/infomation/index.html