开发者实测:国产大模型在“情商”与拟人化交互体验上仍落后 GPT-4o

一位开发者在 V2EX 分享了 API 接入实测对比。在保持相同提示词和记忆机制的条件下,他发现将后端模型从 GPT-4o 替换为 Qwen、Kimi、GLM 等国产大模型后,聊天的“真人感”显著下降。这一反馈指出,尽管国产大模型在逻辑推理和硬核指标上进步神速,但在捕捉用户潜台词、提供情绪价值及自然对话流畅度等软性交互维度上,与 OpenAI 的顶尖模型相比仍存在明显的体验代差。

原文链接:V2EX 分享发现

抢沙发

评论前必须登录!

立即登录   注册