Claude 推出电脑操作功能,向 Agent 方向迈进

Banner

写在前面

过去我们理解 AI 助手,往往还是停留在“你说一句,它回一句”。哪怕是更强一点的编程 Agent,本质上也经常只是一个坐在终端里的高阶助手:你在,它干活;你走开,它也跟着停下来。

Anthropic 这次把 Claude 的 Computer Use(电脑使用)Dispatch(手机派活) 放到一起,真正有意思的地方,不是又多了一个新按钮,而是它让 Claude 往“可被远程调度、可在电脑上自主执行任务”的方向又走了一步。你不只是让它回答问题,而是开始把一个完整任务交给它,让它自己去打开应用、操作浏览器、处理文件、跑测试,甚至在你不坐在电脑前的时候继续推进。

这也是为什么,这次更新会被很多人解读为一个信号:AI 助手正在从“会聊天的界面”,变成“能接任务的执行体”。


这次更新真正重要的,不是电脑控制,而是 Claude 开始更像 Agent 了

从来源内容看,Anthropic 这次发布的核心是两部分:

  • Computer Use:允许 Claude 在获得授权后直接操作电脑
  • Dispatch:允许用户通过手机给 Claude 分配任务

如果你只看字面,这像是“Claude 获得了屏幕控制能力”。但更关键的变化其实是:Claude 不再只是响应输入,而是在接到任务后,自己规划步骤并执行。

这意味着什么?

以前,很多 AI 产品的工作方式都是:

  1. 你把问题输进去
  2. 它生成答案
  3. 你自己再去操作电脑、切换工具、整理文件、执行命令

而现在,Anthropic 想推进的是另一种模式:

  1. 你描述目标
  2. Claude 自己拆解任务步骤
  3. 它按顺序打开应用、切换页面、输入内容、处理文件
  4. 你只在关键时刻确认或中断

这正是 Agent 和普通聊天助手最核心的区别:不是更会说,而是更能做。


Computer Use 到底能做什么

来源里对这个功能的描述相当明确。Computer Use 已经被集成进两款桌面产品里:

  • 面向知识工作者的 Claude Cowork
  • 面向开发者的 Claude Code

当用户描述一个任务后,Claude 会先规划执行步骤,然后依次进行具体操作。它不只是“建议你怎么做”,而是真的会:

  • 打开应用
  • 操作浏览器
  • 处理文件
  • 点击界面
  • 键盘输入
  • 在不同工具之间切换

而且执行前会先把操作计划展示出来,等待用户确认。用户也可以在执行过程中随时打断。这一点很重要,因为它说明 Anthropic 没有把它做成完全黑盒自动化,而是保留了人类监督的安全边界。

换句话说,Computer Use 想做的不是“完全脱离你”,而是让 Claude 成为一个可监督的执行型助手


Dispatch 的意义,是把“派活”这件事从电脑前解放出来

如果说 Computer Use 解决的是“Claude 能不能在电脑上动手”,那 Dispatch 解决的就是“你能不能不坐在电脑前,也把任务交出去”。

来源中提到,Dispatch 是 Computer Use 的一个入口。用户可以直接通过手机给 Claude 分配任务,比如:

  • 每天早上查看电子邮件
  • 打开 Claude Cowork 或 Claude Code 会话
  • 生成晨间简报
  • 运行测试

这背后真正改变的是工作流。

以前你要想让 AI 帮你处理事情,通常得回到电脑前,开终端、开窗口、开会话,再把任务说清楚。现在 Anthropic 给出的新模式是:你在手机上把任务扔出去,然后去做别的事,等你回到电脑前时,事情已经在推进,甚至已经做完。

这已经不是“移动端聊天入口”那么简单了,而是把 Agent 调度权从桌面延伸到了移动端。


它覆盖的,其实是大多数日常办公里的电脑操作

来源里有一句判断很关键:Computer Use 几乎涵盖了日常办公场景中,用户在电脑前能完成的所有操作。

这句话当然带一点产品表达,但它指向的能力边界很清楚:只要一个任务主要依赖图形界面、浏览器、文件系统和常见应用切换,Claude 就有机会接管其中很大一部分重复操作。

这类场景包括:

  • 查看和整理邮件
  • 打开并处理文档
  • 浏览网页获取信息
  • 进入已有工具环境执行任务
  • 跑测试或检查结果
  • 生成固定节奏的日报、简报

从这一步开始,AI 助手的定位就变了。它不再只是一个回答问题的窗口,而开始接近“一个能帮你完成桌面工作流的执行层”。


为什么 Anthropic 强调第三方集成优先

来源里还有一个非常值得注意的细节:Claude 会优先调用已经连接的第三方集成,比如 Slack、Calendar、Notion、GitHub;只有没有连接器时,才申请屏幕访问权限,直接操控应用界面。

这其实透露了 Anthropic 对 Agent 的一套成熟思路:

第一层:能走结构化接口,就不走屏幕控制

如果已经有 Slack、GitHub、Notion 这类集成,Claude 会优先通过连接器完成操作。这样更稳定,也更安全,因为它面对的是明确的 API 或数据接口,而不是脆弱的 UI 元素。

第二层:没有现成接口时,再走 Computer Use

如果某个操作没有打通连接器,Claude 才退回到“看屏幕、控鼠标、敲键盘”的方式。这个逻辑和人很像:有 API 当然比点来点去更可靠,但现实世界里总有很多系统没有标准接口,这时候屏幕控制就成了最后一层通用执行能力。

这也是 Computer Use 真正有价值的地方:它不是用来取代集成,而是用来补足集成覆盖不到的部分。


这次更新处在什么阶段

目前这套能力并不是全面正式开放,而是以 研究预览(Research Preview) 的形式提供给 Pro 和 Max 用户,并且仅支持 macOS

这两个限制都很关键。

1. 研究预览意味着它还不稳定

Anthropic 自己也承认,由于功能刚推出,一些复杂任务可能无法一次性成功完成。这很正常,因为 Computer Use 这类能力天然依赖:

  • 界面元素识别
  • 多步骤状态判断
  • 应用切换的容错
  • 页面加载和系统反馈

只要其中某一步判断偏了,整个流程就可能失败。也就是说,现阶段更适合把它看成“已经有明显实用性,但仍在打磨”的能力,而不是一个百分百可靠的自动化系统。

2. 仅支持 macOS,说明它还没进入真正的大众阶段

只支持 macOS 这一点,会直接挡住不少开发者和企业用户。因为很多人的主力环境仍然是 Windows,或者混合设备环境。换句话说,这次更新的重要性很高,但它的可用范围暂时还不算广。


这不是 Anthropic 第一次做 Computer Use,但这次更接近“能用”

来源还提到一个背景:Anthropic 其实并不是现在才开始做 Computer Use。

  • 2024 年 10 月,基于 Claude 3.5 Sonnet 的 API 版 Computer Use 已进入公测
  • 今年初,Cowork 预览版已经加入桌面文件处理能力
  • 这一次,则是把手机端 Dispatch 和屏幕控制整合到了一起

如果把这几步连起来看,就很清楚了:Anthropic 不是突然做了一个新花样,而是在持续把“Claude 从模型接口变成执行型产品”这条路线往前推。

API 版 Computer Use 解决的是开发者接入能力;桌面文件处理增强的是本地操作面;而 Dispatch + Computer Use 的整合,则补上了远程调度这一环。

也正因为这样,这次更新才更像一个节点:它不是能力首次出现,而是第一次让“移动分发任务 + 桌面自主执行”形成了一个完整闭环。


它为什么不是 OpenClaw 的直接竞争对手

来源里专门强调了一点:Anthropic 这次推出的 Computer Use 和 Dispatch,并不是一个新的独立 AI 产品,因此不能简单把它理解成 OpenClaw 的正面平替。

这个判断是成立的。

Claude 这边的逻辑:给现有产品增加一个远程控制入口

Anthropic 的做法是:

  • 你已经在用 Claude Cowork 或 Claude Code
  • 文件、工具、配置、环境本来就都在原来的工作空间里
  • 现在只是多了一个入口,让你能从手机派任务,或者让 Claude 直接控制电脑界面

也就是说,它更像是在增强现有产品的行动能力。

OpenClaw 的逻辑:一整套完整框架

而 OpenClaw 本身是另一种产品哲学。它要求你自己部署、自己接模型、自己接消息渠道、自己配置系统环境。它不是给一个现成产品加入口,而是给你一整套 Agent 框架,让你自己搭。

所以两者虽然都在往 Agent 方向走,但落点并不一样:

  • Anthropic 路线:从现有产品往上长出 Agent 能力,重视开箱即用和产品体验
  • OpenClaw 路线:把调度层和模型层拆开,强调自由度、可控性和开发者能力

这也是为什么很多中国厂商的“类 OpenClaw”产品,最后会走出第三条路:保留开源框架那种调度逻辑,但把部署过程包装成开箱即用的产品服务。


这背后反映的是 AI Agent 正在形成两条技术路线

来源最后总结得很有代表性:当前 AI Agent 赛道,正在逐渐形成两条清晰路线。

路线一:官方集成路线

以 Anthropic 的 Computer Use 为代表,这一类方案的特点是:

  • 从模型到产品闭环都由官方提供
  • 用户几乎不需要技术背景
  • 开箱即用
  • 操作体验更统一
  • 但通常会被锁定在单一模型生态里

它的核心逻辑不是“让你搭建一个 Agent 框架”,而是“让现有的 AI 产品直接长出行动能力”。

路线二:开源框架路线

以 OpenClaw 为代表,这一类方案的特点是:

  • 调度层与模型层分离
  • 可自由接 Claude、GPT 或本地模型
  • 可通过 Telegram、微信等渠道调度
  • 自由度更高
  • 但需要用户承担更多部署和维护成本

这两条路线并不是谁替代谁,而是服务不同人群:

  • 想立刻用起来的人,会更偏向官方集成路线
  • 想自己掌控系统、模型、渠道和工作流的人,会更偏向开源框架路线

而中国大厂现在做的很多“龙虾”产品,本质上是在这两条路线之间做融合:既保留 Agent 框架的任务调度能力,又把它包装成普通用户也能直接使用的服务。


Claude Code 到底是什么,为什么这次更新对开发者更值得关注

对开发者来说,这次更新最值得关注的,其实未必是 Claude Cowork,而是 Claude Code

Claude Code 不是传统意义上的代码补全工具,而是一个围绕任务目标行动的自主编程 Agent。它能做的事情包括:

  • 阅读项目文件和代码结构
  • 搜索整个仓库里的上下文
  • 修改多个文件
  • 执行终端命令
  • 跑测试和构建
  • 分析报错并继续修复
  • 配合 Git 做分支、提交、PR 等操作
  • 通过 MCP 接外部工具和数据源

这次 Computer Use 和 Dispatch 被接进 Claude Code,意义就在于:它开始不仅能在终端里工作,还开始更像一个可以被远程调度、并能借助桌面环境完成任务的开发执行体。

目前官方公开的常见订阅档位包括 Claude Pro 约 20 美元/月,Max 5x 约 100 美元/月,Max 20x 约 200 美元/月。对国内用户来说,支付和网络环境通常都不算轻松。如果嫌官方订阅折腾,也可以看看 Code80,真实订阅帐号转 API,换个 endpoint 就能直接用,体验和官方比较接近。详情可以到官网了解:code.ai80.vip


常见问题

Q1:Computer Use 和普通聊天式 Claude 有什么本质区别?

A:普通聊天式 Claude 主要负责理解和生成内容,而 Computer Use 让 Claude 进一步拥有了执行层能力——它可以实际去操作电脑,而不只是告诉你下一步该怎么做。

Q2:Dispatch 的价值是什么?

A:Dispatch 的价值不是多了一个移动端入口,而是把“派任务”这件事从电脑前解放出来。你可以先把任务扔给 Claude,再回来查看结果,这更接近 Agent 工作流。

Q3:为什么说这次更新标志着 Claude 向 Agent 方向迈进?

A:因为它已经不只是响应指令,而是在接到目标后自行规划步骤、调用集成、必要时操控界面完成任务。这种“理解 + 规划 + 执行”的闭环,就是 Agent 的核心特征。

Q4:它现在能完全替代人工办公或开发吗?

A:还不能。Anthropic 自己也提到,复杂任务未必一次成功,而且目前还是研究预览阶段,仅支持 macOS。现阶段更适合把它看作一个已经具备明显实用性的早期执行助手。

Q5:它和 OpenClaw 是同一类产品吗?

A:不完全是。OpenClaw 更像一套需要自行部署和配置的完整 Agent 框架,而 Claude 这次是给现有产品增加远程调度和电脑执行能力,两者的产品逻辑不同。

Q6:国内用户如果想更方便地用上 Claude Code 这类能力,有没有更省事的方式?

A:如果主要是想少折腾支付和网络,国内用户可以通过 Code80 更方便地使用。

AD · 推广 前往 code80.ai › code80.ai · AI 编码 API 聚合 Claude / GPT 多模型统一接入,稳定不限速,按量计费,几行配置接入 Claude Code。

抢沙发

评论前必须登录!

立即登录   注册