本报告基于 AMD EPYC 和 Nvidia A10 硬件环境,对 10 款轻量级开源大模型进行了系统化翻译测评。研究不仅对比了基础分数,更从语义还原、上下文连贯、Markdown 结构保真及并发性能六个维度进行深度剖析。结果显示,Qwen3.5-9B 凭借卓越的基础质量和结构还原能力夺得综合第一,而 HY-MT1.5-1.8B 则在语义还原与高吞吐之间实现了最佳平衡。测评指出,风格语气是当前模型的通病,且长上下文翻译仍是技术难点。
原文链接:Linux.do
本报告基于 AMD EPYC 和 Nvidia A10 硬件环境,对 10 款轻量级开源大模型进行了系统化翻译测评。研究不仅对比了基础分数,更从语义还原、上下文连贯、Markdown 结构保真及并发性能六个维度进行深度剖析。结果显示,Qwen3.5-9B 凭借卓越的基础质量和结构还原能力夺得综合第一,而 HY-MT1.5-1.8B 则在语义还原与高吞吐之间实现了最佳平衡。测评指出,风格语气是当前模型的通病,且长上下文翻译仍是技术难点。
原文链接:Linux.do
评论前必须登录!
立即登录 注册