DeepMind AlphaGeometry2:AI 几何解题新突破
谷歌 DeepMind 研究实验室推出最新 AI 系统 AlphaGeometry2,其在解决几何问题方面的卓越表现,已经超越国际数学奥林匹克(IMO)比赛中的平均金牌得主水平。这个系统是 AlphaGeometry 的升级版本,研究人员表示,AlphaGeometry2 有能力解决过去 25 年 IMO 中 84% 的几何难题。
为何 DeepMind 关注高中数学竞赛?
DeepMind 认为,探索解决复杂几何问题的新途径,特别是欧几里得几何,对于提升 AI 的推理能力至关重要。证明数学定理,例如解释勾股定理的原理,需要逻辑推理和选择多个步骤的能力。DeepMind 认为,这些问题解决能力对未来通用 AI 模型的构建具有重要意义。
AlphaGeometry2与AlphaProof:数学推理的强强联合
今年夏天,DeepMind 展示了结合 AlphaGeometry2 与数学推理 AI 模型 AlphaProof 的系统,该系统在 2024 年 IMO 的六个问题中成功解决了四个。这种方法不仅限于几何问题,还可以扩展到其他数学和科学领域,例如复杂的工程计算。
AlphaGeometry2 的核心技术
AlphaGeometry2 的核心构成包括谷歌 Gemini 系列的语言模型和一个“符号引擎”。Gemini 模型协助符号引擎通过数学规则推导出问题的可行解。IMO 几何问题通常基于需要添加“构造”的图形,如点、线或圆。AlphaGeometry2 的 Gemini 模型能够预测哪些构造可能有助于解决问题。
训练数据与性能
值得关注的是,AlphaGeometry2 在解决 IMO 问题时,使用了 DeepMind 自己生成的超过 3 亿个定理和证明的合成数据进行训练。研究团队选择了过去 25 年中 IMO 的 45 个几何问题,并进行了扩展,形成包含 50 个问题的集合。AlphaGeometry2 成功解决了其中的 42 个,超越了金牌得主的平均水平。
AlphaGeometry2 的局限性与未来展望
AlphaGeometry2 仍存在一些局限,比如无法处理具有可变数量点、非线性方程和不等式的问题。尽管如此,这项研究引发了关于 AI 系统应该基于符号操作还是神经网络的讨论。AlphaGeometry2 采取了一种混合方法,融合了神经网络和基于规则的符号引擎。
AlphaGeometry2 的成功为通用 AI 的未来发展提供了新的思路。虽然目前还未完全实现自给自足,但 DeepMind 团队的研究预示着未来可能会涌现出更多自足的 AI 模型。
论文入口:https://arxiv.org/pdf/2502.03544
更多AI行业最新资讯新闻信息请关注AI人工智能网站--AITOP100平台--AI资讯专区:https://www.aitop100.cn/infomation/index.html