📰 龙虾新闻

Anthropic发布Claude电脑控制功能，AI代理实现本地真实操作

发布时间：2026-03-29 分类：龙虾新闻

摘要：Anthropic发布Claude电脑控制功能，AI代理进入实操阶段AI第一次真正"动手"你在手机上给AI发了一条消息，让它查资料、填表格、发邮件。几秒后，这些任务已经在你电脑上完成了——你没碰键盘，没打开任何软件。这是Anthropic新发布的Claude代理功能带来的实际体验。它不是演示视频里的效果，而是AI第一次在真实的本地环境里执行操作：打开浏览器、点击按钮、填写表单、发送文件。本地...

Anthropic发布Claude电脑控制功能，AI代理进入实操阶段

AI第一次真正"动手"

你在手机上给AI发了一条消息，让它查资料、填表格、发邮件。几秒后，这些任务已经在你电脑上完成了——你没碰键盘，没打开任何软件。

这是Anthropic新发布的Claude代理功能带来的实际体验。它不是演示视频里的效果，而是AI第一次在真实的本地环境里执行操作：打开浏览器、点击按钮、填写表单、发送文件。

本地控制：这次的技术突破在哪里

从云端到本地

此前的AI代理大多在云端处理信息，生成文本或调用有限的API。Claude这次的变化是把执行层落到了用户本地——AI可以直接操作你机器上运行的应用程序。

具体实现方式：

Claude通过一个轻量级本地代理程序与用户电脑通信
所有连接经过加密，数据不经过第三方服务器
每一步操作实时反馈给用户，可以随时中断或接管

这个架构的意义在于：AI的执行权限从"告诉你怎么做"变成了"直接去做"。

任务链：不只是执行单步指令

Claude能处理多步骤的连续任务。举个例子，用户说"找到这家公司的财务报表，整理进表格，发给我"，Claude会：

打开浏览器，访问目标网站
定位并下载财务报表
打开办公软件，将数据填入指定位置
通过邮件将完成的文件发送给用户

整个过程不需要用户介入，也不需要提前写脚本。Claude用自然语言理解指令，通过API与各应用交互，并生成完整的操作日志供用户核查。

和OpenAI的Operator比：差异在哪

OpenAI的Operator同样做了类似的事情，但两者的技术路径有明显差异。

Operator更依赖云端处理和预定义的任务模板，在常见场景下表现稳定，但遇到非标准流程时灵活性有限。Claude的本地执行架构在几个维度上有不同的取舍：

维度	Claude	Operator
执行位置	本地	云端为主
响应延迟	更低	依赖网络
数据传输	最小化	经过云端
任务灵活性	动态适应	模板依赖

本地执行减少了数据离开用户设备的机会，对隐私敏感场景有实际意义。

实际能用在哪些地方

目前看来比较成熟的应用场景：

办公流程：处理收件箱、整理会议记录、按模板生成报告。这类任务步骤固定、容错率高，适合AI代理接管。

数据收集与整理：从多个网站抓取数据、合并到表格、生成图表。人工做很耗时，Claude可以批量处理。

跨应用操作：把A软件里的内容搬到B软件，或者根据某个触发条件自动执行一系列操作。

需要说明的是，当前版本对复杂判断场景（比如需要理解上下文才能决定下一步的任务）仍有局限，不是所有任务都能无人值守地跑完。

对国内AI代理开发的参考价值

国内的智能体项目（AutoGLM、AppAgent等）在本地化场景和中文理解上有自己的优势，但在任务链的稳定性和跨应用执行能力上还有差距。

Claude这次发布有几个值得关注的技术方向：

本地代理的轻量化设计：不依赖重型框架，降低部署门槛
操作日志的透明度：用户能看到AI做了什么，建立信任的前提
中断与接管机制：AI不是黑盒，用户保留控制权

这三点不只是产品设计，也是AI代理能否被普通用户接受的关键。

开发者怎么接入

目前Claude的电脑控制功能通过API开放，文档中提供了以下基础调用结构：

import anthropic

client = anthropic.Anthropic()

response = client.beta.messages.create(
    model="claude-opus-4-5",
    max_tokens=1024,
    tools=[
        {
            "type": "computer_20241022",
            "name": "computer",
            "display_width_px": 1920,
            "display_height_px": 1080,
            "display_number": 1,
        }
    ],
    messages=[
        {
            "role": "user",
            "content": "打开浏览器，搜索Anthropic官网，截图发给我"
        }
    ],
    betas=["computer-use-2024-10-22"],
)

工具返回的结果包含截图和操作状态，开发者可以在此基础上构建自己的任务流。

现在值得关注什么

Claude电脑控制功能的发布，标志着AI代理从"对话助手"向"执行代理"的实质性转变。这不是功能点的叠加，而是人机交互模式的一次结构性变化——用户从操作者变成了指令者。

对开发者来说，现在是研究这套架构的好时机：本地代理的权限边界怎么设计、任务失败时的回滚机制、多步骤任务的状态管理，这些都是接下来需要认真对待的工程问题。

对普通用户来说，可以先从低风险的任务开始尝试，保留操作日志，熟悉AI的行为模式，再逐步扩大授权范围。

返回首页