近日,有科技社区用户爆料称,小米内部测试的大模型(疑似为mimo-v2.5-pro)在被问及身份时,坚称自己“是Claude”,且在切换模型版本后依然出现该错误。这一“身份认知错乱”现象迅速引发热议。技术分析认为,这极可能是由于模型训练过程中过度使用了Claude生成的合成数据进行蒸馏,导致模型在指令对齐阶段意外继承了原模型的自我认知。尽管模型蒸馏是行业常用手段,但如此明显的“继承”特征,也让外界对国产大模型的独立研发成色及数据清洗能力产生了质疑。
原文链接:Linux.do
近日,有科技社区用户爆料称,小米内部测试的大模型(疑似为mimo-v2.5-pro)在被问及身份时,坚称自己“是Claude”,且在切换模型版本后依然出现该错误。这一“身份认知错乱”现象迅速引发热议。技术分析认为,这极可能是由于模型训练过程中过度使用了Claude生成的合成数据进行蒸馏,导致模型在指令对齐阶段意外继承了原模型的自我认知。尽管模型蒸馏是行业常用手段,但如此明显的“继承”特征,也让外界对国产大模型的独立研发成色及数据清洗能力产生了质疑。
原文链接:Linux.do
评论前必须登录!
立即登录 注册