Vercel 开源工具让 AI 能「点按钮、发微博」— 浏览器自动化正在从程序员专属变成普通人也能用的东西

这是什么

过去，AI 能「读」网页，却不能「动」网页——它可以分析一段 HTML 代码，但无法替你点击「提交」按钮、在搜索框里输入内容、或者帮你给某条微博点赞。这道墙，让大量看起来很简单的任务，实际上 AI 根本无从下手。

Vercel Labs（美国云平台 Vercel 的实验部门）近期开源了一个叫 Agent Browser 的命令行工具（CLI，即通过文字指令控制电脑的工具），专门为 AI 操控浏览器而设计。安装之后，你只需要用自然语言告诉 AI「去微博，给央视新闻第一条点赞」，它就能真的打开浏览器、找到按钮、完成操作。

这个工具有一个特别实用的细节：它可以直接连接你正在使用的 Chrome 浏览器，沿用你已有的登录状态，不需要重新输密码。换句话说，只要你平时已经登录了某个平台，AI 就能直接以你的身份去操作。

行业怎么看

支持者认为，这类工具的出现，标志着 AI 自动化（让 AI 代替人完成一系列连续动作）正在从「写代码才能用」向「说话就能用」迁移。以往做浏览器自动化，开发者需要手写复杂的脚本，指定每一个按钮的精确位置。Agent Browser 的思路是让 AI 自己「看懂」页面结构，再决定怎么操作—— 这降低了相当大的使用门槛。

但反对意见和风险同样值得正视。首先是安全隐患：允许 AI 以你的登录身份操作浏览器，意味着一旦 AI 理解出错，或者被恶意指令干扰，它可能在你不知情的情况下发帖、删除内容，甚至触发支付动作。其次，这类工具目前仍需要一定的技术基础才能配置，宣传中的「一句话搞定」，前提是你先完成了安装和授权的若干步骤——对非技术用户来说，这道门槛依然存在。此外，各大平台（微博、小红书、X 等）对自动化操作有明确的反爬和反机器人机制，规模化使用面临封号风险。

对普通人的影响

对企业 IT：这类工具最直接的落地场景是内部流程自动化——定期截图存档、跨系统录入数据、批量测试网页功能。IT 部门值得评估它能替代哪些人工重复操作，但同时需要建立明确的权限边界，防止 AI 越权操作敏感系统。

对个人职场：对于日常需要处理大量重复性网页操作的岗位（数据收集、内容发布、竞品监控），这类工具提供了一个新的效率方向。我们的判断是：短期内它更像是「会用的人多一个工具」，而非「不会用的人面临威胁」。

对消费市场：当浏览器自动化工具变得足够易用，消费端最先感受到的可能是服务质量的变化——无论是商家用它批量管理评论和库存，还是平台用它检测异常行为。这场猫鼠游戏会比工具本身更值得关注。

Vercel 开源工具让 AI 能「点按钮、发微博」— 浏览器自动化正在从程序员专属变成普通人也能用的东西

这是什么

行业怎么看

对普通人的影响

相关推荐

Codex 上手机，不只是补入口

UMG 与 TikTok 联手围堵 AI 音乐

华为真正追的是制程自主权

数据中心电力开始被重估

ima 想把知识库变成分发层

ECB 用 AI 给银行做压力测试