今天早上翻 Follow Builders 抓回来的素材,本来只是想扫一眼有没有 Claude、Codex 的新动静,结果最先卡住我的是 Peter Yang 那条旅行规划。
他让 Codex 打开浏览器,去 Google Flights 和酒店官网查价格、存直订链接,再整理成一个文档。这个例子小得很,甚至有点生活化,但它比很多宏大的 Agent demo 更说明问题:人想要的不是又一段“日本旅行建议”,而是有人把查价、比价、留链接这种烦活先做掉。
Peter Yang:让 Codex 浏览 Google Flights 和酒店官网,查价格、保存直订链接并整理成文档,是“Agent 代办旅行规划”的好案例。另提到模型访问可能会引入身份验证,以及移动端直接使用 Codex 的体验仍有摩擦。
我自己做站、写内容、折腾 AI 编程入口时也经常遇到类似的事。最耗时间的往往是那些一层一层的小动作:打开页面、找资料、比几个选项、复制链接、整理成能继续用的东西。AI 如果只停在回答层,帮不了太多;一旦它开始碰浏览器、碰文件、碰命令行,体验就变味了。
Codex 最有意思的地方,反而不是写代码
素材里还有一条更夸张的说法:OpenAI 内部什么都用 Codex。这个说法当然要打个折听,X 上的表达经常会放大一点。但它提醒我一件事,Codex 这类工具正在从“程序员的工具”变成“公司里会干活的入口”。
如果只是写代码,那它还在工程部里面转;如果能帮运营查数据、帮产品整理竞品、帮老板把一堆链接变成一个可执行清单,它就不再是 IDE 插件了。它更像一个新同事,只是这个同事现在还挺毛躁,权限也不好管,很多时候需要你盯着。
Thibault Sottiaux:评价一次更新“非常棒”;提到 Codex App 在 2 月 2 日发布后推动了工程之外的采用;“OpenAI 内部一切都用 Codex”这条互动很高,适合沉淀为 Codex 组织采用案例。
这里面有一个现实问题:很多任务还不能放心交给 Agent。让它查酒店价格可以,让它直接下单就要谨慎;让它改一个页面可以,让它不经 review 直接上线也不行。Agent 会先吃掉那些低风险、步骤多、重复性强的工作。
以后公司文档里,可能会多一类东西
Guillermo Rauch 提到 Next.js 在错误修复提示里放 Copy prompt 按钮,也提到把设计标准喂给 coding agents。这个细节我挺喜欢,因为它不玄。它把一个很具体的问题摆出来:当开发者遇到错误时,下一句该怎么问 AI?
很多团队现在的文档还是写给人看的,写得漂亮,执行时靠经验补全。Agent 进来以后,文档会被迫变得更硬一点:组件怎么用、什么颜色不能乱改、错误怎么复现、改完要跑哪些检查,都得写清楚。写不清楚,人能靠默契糊过去,AI 会直接把坑放大。
Guillermo Rauch:Next.js 错误修复提示里加入“Copy prompt”按钮,被他称为 agentic art;另谈到如何把设计标准灌输给 coding agents;还提到 Grok Imagine Video 在 Vercel AI Gateway 中占开发者视频生成约 50%,可作为 AI Gateway 使用趋势素材。
软件不好卖了,这句话有点刺耳
Zara Zhang 说,打造受众和打造公司正在变成一件事。这个判断不新,但放在 AI 工具越来越便宜的背景下,会更扎心:做东西的成本降了,解释自己为什么值得被信任的成本反而上来了。
Aditya Agarwal 那条更直接:客户不想买软件,想买结果。我觉得这句话可以挂在很多 AI 产品的门口。客户不是缺一个按钮、一个后台、一个聊天框,客户缺的是“这件事最后有没有人帮我搞定”。
所以我现在看 AI 编程产品,也不会只看模型名字和参数。更实际的问题是:它能不能稳定打开?能不能接近国内用户的支付和使用习惯?出了问题有没有替代入口?这些东西听起来不性感,但它们决定一个工具能不能真的每天用。
Zara Zhang:反驳“打造受众和打造公司相冲突”的误解。她认为两者正在合一,创始人最重要的工作之一是讲故事,因为 building 变便宜、attention 变昂贵。这条非常适合放进个人 IP / build in public 观点库。
Aditya Agarwal:认为现在做纯软件公司非常难,因为客户不想要软件而想要结果,横向软件有倒计时,每个客户都要深度定制。机会仍在,但需要对未来 2-3 年有非常异端的判断。这条适合沉淀为“从 SaaS 到 outcome / services-as-software”的核心观点。
底层也在悄悄换轨
Cloudflare 那期访谈里聊到 bot 流量超过人类流量。这个话题离普通开发者有点远,但后果会很近:如果访问网页的不再主要是人,而是 bots 和 agents,广告、统计、风控、内容分发都会被重新算一遍。
Claude 接入 Apple Foundation Models framework 又是另一条线:简单任务本地跑,复杂任务交给云端强模型。这个组合比“一个超级模型解决一切”更像真实产品会采用的路线,省钱、快,也更容易解释隐私边界。
这也是我为什么会把 Code80 放在这篇文章里:<a href=”https://code.ai80.vip/home” target=”_blank” rel=”noopener noreferrer”>https://code.ai80.vip/home</a>。它不是为了蹭一个概念,而是因为很多人真的卡在最前面那一步:想试 Claude、Codex、AI 编程工具,但支付、账号、入口、稳定性先把热情磨没了。一个稳定入口未必宏大,但对每天要写代码、改站、做内容的人来说,够具体。
我不觉得 Agent 明天就会接管公司。很多任务它还做不好,尤其是牵涉钱、权限、责任归属的时候,人还是要在旁边。
但它已经开始吃掉那些原本没人愿意做、又必须有人做的小步骤。先从订旅行、修报错、整理链接开始,后面会慢慢挪到更正式的业务流程里。这个过程不会像发布会里那么漂亮,大概率会很碎、很吵、很多返工。但产品机会往往也就藏在这种不漂亮的地方。
素材来源
本文参考 Follow Builders 抓取的公开动态与官方内容,原始链接如下:









评论前必须登录!
立即登录 注册