推荐

(2025-10-19热点)-微分几何难题无解!GPT

2025-10-20 23:15 100 浏览

2025年10月的事情挺有趣的啦,一个是陶哲轩拿着GPT-5Pro在解微分几何的题,人工智能把那些公式排得整整齐齐,推理看着也没啥问题,但题目还是没解出来。

另一头,这套AI又在全球最难的数学考试FrontierMath上拿了13%的成绩,居然排在第一名。

这事挺让人捉摸的,你说它挺牛逼的,可苦恼的是关键题都没法解出来。

要说它不行吧,又偏偏能在比赛里拿高分。

其实说到底就一个事儿,AI到底是真懂数学,还是只是会做题罢了。

我平时挺喜欢研究科技和数学结合的那些事情,总感觉AI的“灵光”跟人类的“理解”可不是一回事儿。

这次陶哲轩的试验,简直把这都揭得一清二楚。

陶哲轩挑的这个题,挺讲究,不是那种题库里的老熟面孔,而是放在MathOverflow上挂了整整三年的公开难题。

在三维空间里,如果一个光滑球面上所有点的主曲率都不超过1,那它包围的体积,能不能比单位球还大呢?

这题算是微分几何里的问题,陶哲轩自己对这块也不算 specialize,主要是想试试AI能不能碰出点新点子。

一开始,他让AI先搞定个简单的“星形区域”,也就是说,从球心往外看,能看到的区域都长啥样。

没过多久,AI就搞出了答案,不仅算得准确,还用了三个定理,其中一个是Minkowski第一积分公式,陶哲轩自己都没提过的,AI主动发现了,还提供了两种证明方式。

陶哲轩后来都说:“这部分没得说,跟个技术娴熟的研究生似的,帮我节省了不少算账的时间。”

接下来就出状况了,陶哲轩打算试试“曲面离球形有点远”的那种情况,他自己先琢磨出个想法,想用“有限计算”来简化一下。

结果AI沿着这个思路往下推,算得挺仔细,公式也没出错,可偏偏方向搞反了。

陶哲轩后来发博客写道,这东西就跟着我那错误的想法走,不去怀疑,还能用复杂的公式把错的掩盖得让人觉得对的。

这次失误反倒帮了陶哲轩,他专注于AI那错误的推断,忽然领悟到问题的核心不在“近似球形”,而是那些“又细又长的非凸曲面”。

这种曲面可以被拉得很长,但几乎不增加体积,正是导致体积下限难以确定的关键所在。

你瞧,AI虽然没直接给出答案,但帮陶哲轩搞明白了题目的核心所在。

陶哲轩那句话说得真有道理,“AI就像一面镜子,帮我把自己思维的界限看得清清楚楚。”

其实,这情况跟工作中碰到的事儿挺像的,你让助理帮忙处理点琐事,他能把表格整理得井井有条,数据也算得一点不过错,但要是你给的方向歪了,他可不会提醒你,反倒会沿着错的方向一岗一岗地干下去。

这个阶段的AI啊,基本上就是擅长拿任务来干,执行力没话说,可要叫它自己做决定,真得说它还差点儿火候。

这会儿陶哲轩还在研究AI的限制在哪儿,另一边,全球最难的数学考核FrontierMath的成绩也出来啦。

这个测试跟平时的考试不一样,题目难得连专家都得费几周甚至几个月才搞定,考的不是“会不会算”,而是“能不能想”。

七月刚出来的时候,没一个AI能拿到超过5分。

八月的时候,谷歌的Gemini2.5Pro新增了“重试机制”,如果算错了还能自己调整,结果得分提升到了12%。

到了十月,GPT-5Pro以13%的得分名列第一,其实也就比Gemini多答对一道题,统计上基本没有差距。

挺有趣的是,GPT-5Pro的高分主要集中在代数、线性系统这些“符号化”强烈的题目上。

这些题基本上都跟固定套路相关,只要推理的链条够长,计算能力够强,基本都能搞定。

要是碰到几何构造或者偏微分方程这种得靠直觉的题目,他就基本上卡壳了,几乎没有做对的。

EpochAI也提到,这更像是“算法上的一次小胜,倒不是真正的数学突破”啊。

让我想起以前教我数学的老师说过的话,“会做题的人挺多,但能搞懂题后面逻辑的,可就不多啦。”

就像那个只会背公式、不爱琢磨逻辑的学生一样,AI现在也差不多,背了一堆套路和技巧,面对熟悉的题目还能应付得来,一旦遇到得动脑子、的创新的题,它就真就束手无策了。

陶哲轩后来将这两点联系在一起讲,他说:“AI的聪明是线性的,一步步往前推;而人类的理解则像拓扑一样,能够洞察整体的结构。”

这句话挺贴切的,AI能把每一步都算得很好,但却没法理解这些步骤背后那个整体的逻辑关系。

人类或许会算错几步,但偏偏能一瞬间抓住题目的关键所在。

说到底,无论是陶哲轩的试验,还是FrontierMath拿到的高分,都在强调一件事:当下的AI,最该干的事儿,就是帮人类干活,而不是去取代咱们思考的声音。

陶哲轩以后又搞了个实验,用工具让AI自己验证证明的每一步,结果一连几十行下来,AI验证完了,他反而看不明白整体的逻辑是怎么回事了。

他说:“最好的自动化并不是搞到0%,也不是做到100%”,意思是每个环节都得留点人类的“空白”,让AI去算题,人类则把控整体的方向。

让AI负责写出初稿,然后有人来把关,调整逻辑。

我觉得,这才是真正的AI和人类之间最合适的相处方式。

别指望AI能像陶哲轩那样提出崭新的理论,省下那些繁琐的计算和查资料的时间,让数学家有更多精力去思考“为什么”,就已经相当不错了。

说到底,数学的价值从来都不在于拿到那个答案,而是在于搞懂为什么这个答案还没有出来。

这点,AI暂时还搞不懂,也正是人类最应该牢牢记住的东西。

相关内容
  • 14岁被发掘,17岁获金奖,“巨肺小天后”邓紫棋的励志人生路(2026-04-18热点)
    一袭黑色羽毛纱裙,长发披肩,清纯甜美,邓紫棋难得以淡妆出镜接受采访。化淡妆的她,让人眼前一亮。习惯了大浓妆,差点没认出淡妆的邓紫棋,好清秀的感觉,像变了一个人,真的看不出已经三十岁。01邓紫棋抛去飒爽女王的标签,以邻家女孩的清纯模样示人。令众多网友和粉丝渔民为之惊叹的是,一改往常形象,接近素颜的邓紫棋似乎更加灵动可人。不同的风格,展现不同的
  • 现场抽取顶配手机、智能家电、家居好物及米面粮油多重好礼(2026-04-19热点)
    2026年3月27日至29日,徐良2026“时间折叠”巡回演唱会深圳首站在深圳湾体育中心连唱三场,本次演出以艺人特质与音乐内核为核心,打造兼具技术高度与情感温度的定制舞台、诚意歌单编排与沉浸式青春互动,为本次巡演画上圆满句号。技术与艺术共生,刷新体育馆演唱会视觉上限本次舞台舞美设计摒弃单纯技术堆砌,深度贴合徐良音乐气质与表演内核,打造专属定制舞台。灯光系
  • 不仅当地政府行动起来改善周边停车场、卫生间等配套设施(2026-04-18热点)
    早上六点就去排队,一天仅限 200 个号。老板亲口承认是 " 冰冻鸡 " 也无法劝退食客的品尝热情,这就是广东佛山陈村镇一家乡村小店 " 莫氏鸡煲 " 走红后的日常。因为美食探店博主一个视频,以及老板反常态希望不要拍太好、生意太忙做不了等 " 劝退 " 式言论,反而让小店爆火出圈。截至目前点赞已经超 170 万,也让这家原本每天只接待 10 桌本地客的小店,客流瞬间暴涨 20 倍。原本
  • 邓紫棋的个人资料(2026-04-18热点)
    邓紫棋,香港创作型女歌手,2008年,推出个人首张EP《G.E.M.》而正式出道,获叱咤乐坛生力军女歌手金奖。邓紫棋成长于一个音乐世家,母亲为上海音乐学院声乐系毕业生,外婆教唱歌,舅父拉小提琴,外公在乐团吹萨克斯风。在家人的熏陶下,邓紫棋自小便热爱音乐,喜爱唱歌。邓紫棋5岁时开始尝试作曲及填词,13岁完成了8级钢琴。邓紫棋小学就读中华基督教会协和小学,中学就
  • WSBK葡萄牙站排位赛张雪机车820RR分别获得正赛第二和第九发车位(2026-04-20热点)
    就在昨晚凌晨WSBK葡萄牙站ssp组排位赛(杆位赛)张雪机车820RR车队53号车手和64号车手分别获得排位赛第二和第九的位置,这对于正赛回合来说在前排发车太重要了。随着WSBK排位赛的结束国产新兴品牌张雪机车820RR在中量组的表现比较亮眼,无论是车辆的稳定性能都有很大的提升,在上一站中出现的高速摇摆也没有再次出现,观看比赛的用户都能看到前10名的刷圈成绩只差接近1秒的时
相关推荐
热点
热门内容
  • 酒-啤酒-看图猜成语鸡蛋是黄的(看图猜成语啤酒和鸡蛋和大象)
    更新时间:2022-12-10 00:24:50疯狂猜成语一个鸡飞一个蛋碎答案介绍一览看图猜成语一只下了三个蛋的鸡对着大山和太阳喊猜出来高手小学生看图猜成语作业,第2张图就让家长怀疑人生,全部答对基本没有张恒远jpg,1920×1080,207kb,446_249疯狂猜成语2里面一头猪一个鸡蛋一看图猜成语:不要自欺欺人,不懂就多学*成语玩命猜鸡蛋砸向一块石头的答案? 看图猜成语鸡飞机
  • 红酒-酒-茅台老酒回收价格一览表2022更新,年份老酒市场行情呈平稳趋势
  • 茅台镇36家正规酒厂名单
    茅台镇36家正规酒厂名单茅台镇坐落于贵
  • 茅台1499(酒知识)
    茅台1499:传奇与品质的象征茅台酒,作为中国最著名的白酒之一,自诞生以来便承载着丰厚的历史与文化底蕴。而其中的茅台1499更是其品质与传奇的完美体现。历史渊源与文化积淀茅台酒源于贵
  • (2025-3-20热点)-99热99热99热,网络热词新宠,揭秘“99热”爆红之谜
    近日,随着互联网的飞速发展,各种新型网络用语层出不穷。其中,“99热99热99热”这一词汇在网络上引起了广泛关注。那么,这个词汇究竟是什么意思?它又为何能在短时间内迅速走红呢?本文将为您揭开这个神秘面纱。网络热词的兴起“99热99热99热”这一词汇源于网络,其背后寓意丰富。从字面上看,它似乎是在表达一种热烈的情感。然而,深入了解后,我们发现这个词汇背后隐藏着更深层次的
联系方式
  • 326081657
  • 326081657@qq.com