近日,一个名为“ANE”的开源项目在技术社区引发轰动。开发者通过逆向工程苹果的私有 API,成功破解了 Apple Neural Engine (ANE) 的使用限制,首次实现在该神经引擎上直接运行神经网络的训练过程,而不仅仅是传统的推理加速。该项目有力地证明了苹果将 ANE 限制在推理端纯属软件层面的“封印”,硬件本身完全具备处理反向传播计算的能力。测试显示,该方案无需依赖 CoreML 或 Metal,即可在 ANE 上跑通 Transformer 模型的训练循环。这一突破意味着苹果 M 系列芯片在本地大模型训练方面存在巨大的未被利用的潜力,未来可能大幅降低 AI 开发对独立 GPU 的依赖。
原文链接:Linux.do

IT资源栈
评论前必须登录!
立即登录 注册