谷歌研究登《自然》:AI几何能力接近人类奥数金牌选手

人工智能(AI)再破纪录,这一次,它挑战的是奥数金牌!
谷歌DeepMind最新发布的几何推理模型AlphaGeometry,成功回答了国际数学奥林匹克竞赛(IMO)30个几何问题中的25个,这一成就接近于人类奥数金牌选手的水平。昨天,随着相关研究成果登上《自然》杂志,再次引发学术界的热议与讨论。
除了AI在数学领域表现出来的巨大潜力,一些业内人士指出,这项成果实际上代表着,AI再度向人类的推理能力迈进了一大步。在很短的时间里,这些开创性的工作正推动AI以惊人的速度迭代。
“AI的推理和建模能力已达到了一个新高度,其进化的速度比我们想象的快得多。”上海交通大学智能计算研究院院长葛冬冬教授在接受本报记者采访时如是说。
AI在数学推理方面,取得开创性进展
在AlphaGeometry问世之前,AI的推理能力一直“不太行”,也难以解决几何和数学方面的复杂问题。
但现在,AlphaGeometry展示了AI最新具备的逻辑推理能力,以及发现和验证新知识的能力。在对30道奥数几何题的基准测试中,AlphaGeometry在标准奥数时限内解决了25道——与人类奥数金牌得主平均解决25.9个问题的水平不相上下。和之前最先进的AI系统解决其中10个几何问题的表现相比,AlphaGeometry可谓实现了史诗级升级。
在解决几何问题方面,该模型几乎赶上了最聪明的人类。一位IMO金牌得主受邀作为评审,连连称赞AlphaGeometry的输出结果不仅可以经得起验证,而且表述清晰。不仅如此,在回答奥数真题时,AlphaGeometry还发现了2004年国际数学奥林匹克竞赛定理的一个新版本。
在业界,具备更强的定理证明能力,一直是AI研究的焦点。比如,对于大模型来说,学习定理证明很困难。要知道,OpenAI去年发布的GPT-4,可是连一道奥数题都做不出来!
“可以说,AI在数学推理方面取得了开创性进展。”如今任教于高校的葛冬冬,在学生时代也曾是一位奥数选手。他直言,虽然AlphaGeometry表现抢眼,但也要看到其局限性。因为IMO的赛题通常有六道,分为好几种类型,此次的新模型专注于解决几何类赛题,范围相对狭窄。“但可以预见,类似AlphaGeometry的能力,应该在很短的时间里就可以覆盖到更多数学领域,比如数论、方程等等。”
正如DeepMind研究人员所说的那样,未来更大的挑战在于,AI是否能发现新的数学方法,解决迄今的未解之谜。AI的下一个目标就是:创建能够处理超越人类思维的数学问题的人工智能系统。
解决复杂问题,AI有机会取得更大进展
更大的影响,在数学之外。就在上个月,DeepMind还提出了一种名为FunSearch的新方法,首次利用大型语言模型在数学领域未解之谜及更多科学的挑战性问题上取得新发现。相关成果同样发表于《自然》。日前,DeepMind联合创始人兼首席AGI科学家谢恩·莱格明确表示,“离通用人工智能(AGI),越来越近了。”
复旦大学特聘教授林伟昨天接受本报记者采访时指出,谷歌Deepmind团队专注于一个垂直领域,生成了专业的、大规模的数据集。从目前AI的进展来看,精耕于某一领域,做好数据集标记和大规模专业数据收集测试,同时发展构建精调模型架构与参数,是通向AGI的关键之径。他认为,对于复杂问题的解决,AI有机会取得更大的进展。但实现的前提是,需要具备专业的数据、好的计算模型架构以及可计算的应用场景。
让人难忘的是,过去一年里,全球多个AI大模型各展所长,已然在应用领域掀起巨大变革。以GPT-4为例。通过适当的引导和训练,GPT-4可以根据不同制造业企业提出的小众需求,通过建立复杂的数学模型,帮助解决实际生产问题。
“在复杂建模、推理和设计能力方面,AI正在以前所未有的速度提升。”葛冬冬评论说,不仅GPT-4表现不俗,在建模等不少方面的能力甚至达到了人类研究生的水平,如今AI解决实际问题的能力,无论是广度还是深度,都出现了一个飞跃。“无论是现实领域的诸多复杂问题,还是长期存在且目前无解的科学难题,AI都开始逐步学习、理解,并进行复杂建模。”包括葛冬冬在内,不少业界人士给出预判:接下来,大模型的迭代和进化,一定会达到更令人不可思议的程度。
(原标题:AI几何能力接近人类奥数金牌选手,谷歌DeepMind研究成果登上《自然》 AI进化速度“比想象的快得多”)
本文链接:http://knowith.com/news-2-50.html谷歌研究登《自然》:AI几何能力接近人类奥数金牌选手
声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。
喜报!“聚·奉献”杰出工程师朱衍波荣获“国家卓越工程师”称号
【解读】抓紧推动落实相关政策支持中小企业发展——四部门回应推动民营经济高质量发展
【解读】关于《海淀区积极应对疫情影响助企纾困的若干措施》的问答解读
建设具有全球影响力的商业航天创新发展高地 北京亮出商业航天发展路线图
经济结构不断优化 就业形势总体改善 经济增速名列前茅 2023年我国GDP同比增长5.2%
2023年粤港澳大湾区高价值专利培育布局大赛收官
2023年度《国家科学技术奖励工作办公室网站工作年度报表》
北京市2024年度建设用地供应计划
科技部 财政部关于印发《国家重点研发计划管理暂行办法》的通知
顺义区支持中介机构投资促进实施办法(顺投促文〔2024〕11号)
坚韧不拔:DY月付额度如何套出来(教你6个操作流程)
2025印度阿比特龙价格一览表揭晓:印度阿比特龙多少钱一盒便宜获取只需要1900元!现如今,国内印度阿比特龙代购价格阿比特龙yb价格曝光!
步步高升:拼多多先用后付怎么套出来,拼多多先用后付秒到账的方法
积尘自燃:花呗额度怎么提现出来(教你三种花呗如何自己提现)
奋发图强:羊小咩享花卡怎么套出来,推荐五个最新方法
花团锦簇:东莞代还信用卡取现,可长期帮还,大家都找他操作
欢欣鼓舞:宁波海曙垫还信用卡,怎么刷出来,5种常用方式
探索:京东白条加油包能提现吗,三分钟教你找到适合的商家
第三方白条收款平台《让白条秒变现金!》
苹果id贷是真的吗(新人教程)