AI生成PPT实测对比：豆包体验最佳，ChatGPT排版能力不及格-IT资源栈

针对近期繁重的材料处理需求，某科技爱好者对主流AI生成PPT的方案进行了横向实测与评分。测试对象涵盖了字节跳动的豆包、月之暗面的Kimi、OpenAI的ChatGPT网页版以及基于Codex的PPTMaster技能。实测结果显示，通用大模型在直接生成复杂办公文档方面仍存在显著差异。其中，豆包表现最为出色，其生成的PPT在排版与内容完整性上达到了人工成品的70%左右，且当前提供免费服务，获得了8/10的最高评分。Kimi在修改已有PPT的能力上略胜一筹，但其免费版受限较多，使用成本较高，评分为7/10。相比之下，OpenAI的ChatGPT网页版表现不佳，主要依靠代码脚本生成，导致排版错乱，缺乏针对Office格式的专门优化，仅获4/10分。基于Codex与PPTMaster技能的组合方案虽优于纯网页版，但仍处于概念稿阶段，实用性有限。此次测评揭示了当前AI办公领域“垂直应用优于通用模型”的现状，同时也反映出用户对于高效率、低成本AI工具的迫切需求。

事件分析

此次测评揭示了通用大模型与垂直AI应用在办公场景下的显著代差。ChatGPT等通用模型倾向于通过生成VBA代码或Python脚本来构建PPT，这种方式在处理复杂的格式对齐和版式美化时极其脆弱，难以满足办公软件对精度的要求。相比之下，豆包和Kimi等国内应用大概率采用了“大模型内容生成+预设模板引擎”的混合架构，即大模型负责提炼大纲和文本，而后端程序调用高度优化的模板进行渲染。这种“Agent化”的处理逻辑绕过了代码生成的不可控性，在成品率和视觉效果上实现了超越。这表明在AIGC落地办公领域的初期阶段，专用的工具链整合能力比单纯的模型智商更能决定用户体验。

💡 核心观点：通用大模型在复杂排版上存在天然短板，目前垂直领域的“模型+模板”架构在实用性上显著优于纯代码生成方案。

原文链接：V2EX 分享发现

AI生成PPT实测对比：豆包体验最佳，ChatGPT排版能力不及格

事件分析

相关阅读

抢沙发

评论前必须登录！