给Transformer浇冷水:AI大模型的“思考”或仅为统计学假象

本文回顾了AI从AlphaGo到GPT-3.5再到DeepSeek-R1的演进历程,指出强化学习虽提升了模型可用性,但也带来了“走捷径”等缺陷。作者认为,当前所谓“思考模型”的突破本质上是通过消耗更多Token来提高概率匹配的准确性,而非真正的逻辑创新。文章断言Transformer架构已逼近天花板,无法仅靠参数堆叠实现AGI,未来的通用人工智能或许需要像AlphaZero那样,具备从零开始学习而非依赖海量数据预训练的能力。

原文链接:Linux.do

抢沙发

评论前必须登录!

立即登录   注册