本评测基于i9-13900K与RTX 4090顶级配置,针对Gemma与Qwen系列的8款30B级本地模型进行了严苛对比。通过GSM8K、BBH及HumanEval+等基准测试,从逻辑推理、代码生成、速度与稳定性四个维度量化评估。结果显示,Gemma-4-31B-IT-Uncensored凭借逻辑碾压与代码满分的综合表现断层夺冠;Qwen3.5-27B成为代码与数学的最优解;SuperGemma4则以极致速度领跑;而部分多模态模型在代码生成上存在严重缺陷。该报告为追求高性能本地AI体验的用户提供了详尽的选型指南。
原文链接:Linux.do

IT资源栈
评论前必须登录!
立即登录 注册