科学家要求ChatGPT解决2000多年前的一个数学问题——它的回答让他们大吃一惊

AI 2026-01-14 17:42:32 荀世文

希腊哲学家柏拉图在大约385 B写过苏格拉底挑战一个学生的“正方形加倍”问题。当被要求将正方形的面积加倍时,学生将每边的长度加倍,却没有意识到新正方形的每边都应该是原来对角线的长度。

剑桥大学和耶路撒冷希伯来大学的科学家选择了这个问题ChatGPT,因为它的解决方案不明显。自从柏拉图在2400年前写作以来,学者们一直在用平方翻倍问题来争论解决它所需的数学知识是否已经在我们体内,通过理性释放,或者只能通过经验获得。因为ChatGPT像其他大型语言模型一样,主要是在文本而不是图像上训练的,他们推断平方翻倍问题的答案不太可能存在于训练数据中。这意味着如果它在没有帮助的情况下得到正确的解决方案,人们可以争辩说数学能力是后天习得的,而不是天生的。

当研究小组走得更远时,答案出现了。9月17日,在《国际科学技术数学教育杂志》上发表的一篇研究文章中,他们要求聊天机器人使用类似的推理将一个矩形的面积翻倍。它的回答是,因为矩形的对角线不能用来使其大小翻倍,所以在几何学上没有解决方案。

然而,来自耶路撒冷希伯来大学的剑桥大学访问学者Nadav Marco和数学教育教授Andreas Stylianides知道存在几何解。

马可说,ChatGPT训练数据中存在虚假声明的可能性“非常小”,这意味着它是根据之前关于平方问题翻倍的讨论即兴做出的反应——这清楚地表明了生成的学习,而不是天生的学习。

“当我们面对一个新问题时,我们的本能往往是根据我们过去的经验尝试一些东西,”马可在9月18日的一份声明中说。“在我们的实验中,ChatGPT似乎做了类似的事情。就像学习者或学者一样,它似乎提出了自己的假设和解决方案。”会思考的机器?科学家们说,这项研究为人工智能版本的“推理”和“思考”的问题提供了新的线索。

因为它似乎是即兴反应,甚至像苏格拉底的学生一样犯错误,马可和斯蒂利亚尼德斯建议ChatGPT可能在使用一个我们已经从教育中知道的概念,叫做最近发展区(ZPD),它描述了我们所知道的和我们最终可能知道的之间的差距,如果有正确的教育指导。

他们说,ChatGPT可能会自发地使用类似的框架,解决训练数据中没有表现出来的新问题,这要归功于正确的提示。

这是人工智能中长期存在的黑匣子问题的一个明显例子,在黑匣子问题中,系统为得出结论而进行的编程或“推理”是不可见和无法追踪的,但研究人员表示,他们的工作最终凸显了让人工智能更好地为我们工作的机会。

“与著名教科书中的证明不同,学生不能假设ChatGPT的证明是有效的,”斯蒂利亚尼德斯在声明中说。“理解和评估人工智能生成的证明正在成为需要嵌入数学课程的关键技能。”这是他们希望学生在教育环境中掌握的一项核心技能,他们说这需要更好的即时工程——例如,告诉人工智能“我希望我们一起探索这个问题”,而不是“告诉我答案”。"

该团队对结果持谨慎态度,警告我们不要过度解释它们,并得出结论认为LLM像我们一样“解决问题”。但是,马可确实将ChatGPT的行为标记为“学习者式”

研究人员看到了几个领域未来研究的空间。较新的模型可以在更广泛的数学问题上进行测试,还有可能将ChatGPT与动态几何系统或定理证明器结合起来,创造更丰富的数字环境,支持直观的探索,例如,教师和学生在课堂上使用人工智能合作的方式。

© 版权声明

相关文章

研究称,“热力学计算”可以将人工智能图像生成的能源消耗削减100亿倍——原型显示出希望,但创建能够与当前模型相媲美的硬件需要艰巨的任务

一份令人费解的新报告称,理论上,“热力学计算”可以大幅降低人工智能生成图像所消耗的能量,只需当前流行工具能量的一百亿分之一。据IEEE Spectrum报道,最近的两项研究暗示了这项新兴技术的潜力,但其支持者承认该解决方案还很初级。
2026-01-29

SK海力士投资100亿美元创建一家总部位于美国的“人工智能解决方案”公司,以重组总部位于加州的Solidigm企业固态硬盘品牌,以支持美国的投资

存储芯片巨头SK海力士正在美国投资100亿美元成立一家新的人工智能解决方案公司,暂定名为人工智能公司。该公司在一份新闻稿中详细说明,新公司将完全获得这项新投资,并能够在其认为合适的情况下部署它,以促进人工智能行业,支持新的人工智能初创企业和发展,并鼓励其在存储芯片开发方面的实力和竞争力。这种投资甚至可能意味着允许更容易获得SK海力士的关键技术,如高带宽存储器(HBM)。
2026-01-29

谷歌探索将人工智能数据中心置于太空-Suncatcher项目希望利用在轨太阳能来扩展人工智能计算

谷歌刚刚宣布,它正在探索将人工智能数据中心送入轨道的想法,以利用太阳的太阳能输出来发电。根据谷歌研究,太阳捕手项目的目标是拥有一个带有谷歌TPU的太阳能卫星星座,这些卫星可以进行光学通信。这将使该公司能够运行一个耗电的数据中心,而不需要在陆地上建造一个数据中心所需的庞大基础设施。
2026-01-29

科学家要求ChatGPT解决2000多年前的一个数学问题——它的回答让他们大吃一惊 暂无评论