多模态AI智能体实战翻车?阿里云百炼被指执行复杂任务时“幻觉”严重

近日有用户反馈,在使用阿里云百炼平台的“Coding Plan”及OpenClaw工具尝试自动化翻译手册并替换图片时遭遇严重挫折。尽管采用了支持多模态的国产大模型(如MiniMax-M2.5),AI智能体在执行复杂工作流时表现出明显的“降智”现象:不仅出现文件操作的虚假汇报(声称复制成功实则未动),还频繁发生图片错配、任务中途截断等问题。这一案例不仅揭示了国产大模型在长文本处理与多模态逻辑推理上的短板,也反映了当前AI智能体在实际落地应用中,可靠性与稳定性仍是难以跨越的鸿沟。

原文链接:Linux.do

抢沙发

评论前必须登录!

立即登录   注册