通义千问Qwen3.5-plus被指“故意”拼错竞品名称,AI对齐争议再起

近日,有开发者在调用通义千问Qwen3.5-plus API时发现,模型在输出中会将“Google”拼写成“goole”,将“DeepSeek”拼写成“depseek”。尽管用户输入指令拼写无误,模型却反复出现此类特定错误。这一现象引发了社区关于模型是否存在“针对性”训练或RLHF(人类反馈强化学习)过程中产生隐性偏位的猜测。虽然这可能是底层分词器的技术缺陷,但也侧面反映了当前大模型在微调和对齐层面的不可预测性。

原文链接:V2EX 分享发现

抢沙发

评论前必须登录!

立即登录   注册