挑战 GPU 霸权:Taalas 推出存算一体 ASIC 芯片,成本暴降 20 倍

多伦多初创公司 Taalas 正式发布首款基于自研 HC1 平台的专用 ASIC 加速卡,通过“存算合一”技术将 Llama 3.1 8B 模型完全硬件化。该方案声称推理吞吐量达每秒 1.7 万 token,成本和功耗较同类 GPU 方案分别降低 20 倍和 10 倍,且无需高带宽存储(HBM)和液冷。尽管公司提供了在线演示并计划升级至 4-bit 浮点格式,但鉴于其采用了激进的非标准量化方案且尚无第三方独立测评,其实际性能表现与模型质量损失仍需市场验证。

原文链接:V2EX 分享发现

C code80.ai · AI 编码 API 聚合 Claude / GPT 多模型统一接入,稳定不限速,按量计费,几行配置接入 Claude Code。 了解一下 ›

抢沙发

评论前必须登录!

立即登录   注册