Playwright MCP 已经能让 AI 通过自然语言完成打开网页、点击按钮、填写表单等浏览器测试动作,甚至可借助浏览器插件复用登录态;我们的判断是:这不是“会不会用 AI 写测试”的问题,而是企业开始试探“能不能让 AI 直接接管一段测试流程”。
这是什么
Playwright 是常见的网页端自动化测试框架,原本主要靠脚本执行;MCP(Model Context Protocol,可让模型调用外部工具的接口协议)接上后,AI 可以直接听懂“去这个网址、点这个按钮、完成这几步”这样的自然语言指令,再驱动浏览器完成测试。
这次实测里,工具接在 Claude Code 上,并搭配 GLM 5.1 使用。更值得注意的是,它不只适合公开页面,还能通过浏览器插件复用已经登录的浏览器实例,这意味着企业后台、云控制台这类过去更难交给 AI 的场景,也开始进入可操作范围。
这件事的重要性不在“省了几行代码”,而在于测试门槛被往下拉了一层:会描述业务流程的人,理论上也能参与自动化测试。
行业怎么看
行业里对这类工具的兴趣很高,因为它切中了企业软件里最费时间的一段脏活:重复点击、回归验证、跨页面检查。对中小团队尤其有吸引力,过去要写脚本、调选择器、维护环境,现在可以先用自然语言把流程跑起来,再决定是否沉淀成正式用例。
但反对意见同样明确。第一,成本并不轻:只做几步操作就会消耗大量 token,这让“让大模型全天候跑完整 E2E(端到端测试)”很难算得过账。第二,它很吃模型能力,不同模型表现差距明显,便宜模型不稳,强模型又贵。第三,浏览器与插件长期运行带来的内存占用和卡顿,也会影响稳定性。
换句话说,Playwright MCP 展示的是方向:AI 正在从“帮你写测试代码”走向“直接替你执行测试”。但在预算、稳定性和安全边界没有解决前,它更适合作为测试助手,而不是测试主力。
对普通人的影响
对企业 IT:这类工具会先进入内部后台、运营系统、管理控制台等高频但重复的流程验证,帮助团队缩短回归测试时间,但短期仍要配套人工复核与权限管理。
对个人职场:会写脚本当然仍然有价值,但更稀缺的能力会变成“把业务流程准确翻译成测试步骤”,懂业务又懂工具的人会更受欢迎。
对消费市场:普通用户暂时不会直接感受到 MCP,但会间接体验到网页和 App 更新后更少出错、更快修复;前提是企业愿意为这套额外成本买单。