这篇文章记录了一次独特的“物理图灵测试”。作者要求GPT、Claude、Gemini及Kimi等主流大模型推导一杯热咖啡随时间冷却的数学公式,并将它们的预测曲线与真实物理实验数据进行对比。尽管现实环境涉及热传导、对流、蒸发等难以精确计算的复杂变量,LLM们给出的公式大多基于简化的指数衰减模型。实测结果显示,虽然大模型的预测趋势大致正确,但在冷却速率的细节精度上与真实物理世界仍有差距。文章生动揭示了LLM在面对高度复杂的现实系统时,是如何运用“直觉”进行近似处理的。
原文链接:Hacker News

IT资源栈
评论前必须登录!
立即登录 注册