硬核复古:开发者在1976年PDP-11古董机上用汇编语言成功训练Transformer

一位开发者通过手写PDP-11汇编语言,在1976年的小型机上成功实现并训练了一个单层Transformer模型。该项目名为ATTN/11,在仅有32KB内存且无浮点单元的硬件限制下,通过精心设计的定点运算和查找表技术,仅耗时5.5分钟便完成了数字序列反转训练。这不仅是对现代AI算法本质的深度探索,也展示了在极简硬件上运行复杂模型的可行性。

原文链接:Hacker News

抢沙发

评论前必须登录!

立即登录   注册