成功运行 loopcoder-40b 模型,性能达81.4%

研究人员成功在硬件上运行了loopcoder-40b模型,达到SWE基准81.4%的准确率,但性能瓶颈明显,仅9 token/s。由于vLLM和SGlang原生不支持该模型,团队采用了GitHub上的PR #31575来支持IQuestCoder模型。目前正准备在Codeforces和SWE-bench平台上进行进一步测试,以验证模型在实际任务中的表现。这一进展展示了社区协作在AI模型优化中的重要作用,但也凸显了硬件兼容性和性能优化的挑战。

原文链接:Linux.do

抢沙发

评论前必须登录!

立即登录   注册