实测发现国产大模型通病:只会“纸上谈兵”,缺乏落地执行力

近日,有开发者在长期使用AI工具OpenClaw后反馈,国产大模型(如DeepSeek、通义千问、智谱GLM)虽推理能力强劲且免费,但在Agent(智能体)的“动手”能力上存在明显短板。用户指出,国产模型常出现“幻觉式执行”,即仅输出详细步骤声称已完成,实则并未调用工具执行任务;而相比之下,Gemini虽成本较高,却能准确落地操作。这一实测案例揭示了当前国产大模型在Tool Use(工具调用)和行动力上的“知行分离”困境。

原文链接:Linux.do

C code80.ai · AI 编码 API 聚合 Claude / GPT 多模型统一接入,稳定不限速,按量计费,几行配置接入 Claude Code。 了解一下 ›

抢沙发

评论前必须登录!

立即登录   注册