事件经过

一位开发者发布了PokeClaw,这是一款开源Android应用,使用Google的设备端推理运行时LiteRT完全在设备上运行Google的Gemma 4模型。该应用连接Android无障碍服务来读取屏幕内容,并根据自然语言命令执行点击操作。不存在任何服务器组件——即使阻断该应用的互联网访问也不会影响功能。模型只需下载一次,即可永久离线工作。源代码已在github.com/agents-io/PokeClaw公开。

独立创始人视角

如果你在手机上处理客户数据、财务记录或专有工作流程的单一人员运营,云端连接的AI助手是一种风险。PokeClaw通过设计而非策略来消除这种风险。独立创始人今天可以自动化的具体工作流程:

  • CRM数据录入:通过语音命令在HubSpot或Notion移动端记录通话,无需手动操作界面。
  • 发票处理:命令助手打开邮件附件、截图并转发到会计应用。
  • 社交排程:使用简单英语指令自动执行Buffer或LinkedIn移动端的重复点击操作。
  • 客户入职表单:跨应用填写重复字段,无需复制粘贴。

LiteRT运行时意味着你不需要高端手机——Gemma 4专为边缘部署设计。将其与Tasker或Android快捷方式配合使用,可实现基于触发器的自动化,无需编写代码。

对独立开发者的意义

大多数手机AI助手(Rabbit R1、Humane、甚至Google的Gemini Live)都会将你的屏幕数据路由到外部服务器。对于处于保密协议下、处理接近HIPAA数据或在受监管行业工作的独立创始人而言,这是硬性障碍。PokeClaw的架构——本地模型、无障碍API、零网络调用——首次使设备端手机助手成为可能,无需定制硬件。这也表明Gemma 4足够小,可以在消费级手机上运行有用的代理任务,这为独立开发者开辟了一个基于LiteRT构建的离线优先自动化工具的新类别。

本周行动项

从github.com/agents-io/PokeClaw克隆PokeClaw仓库,侧载到Android设备(建议Android 10及以上),完成一次性Gemma 4模型下载,然后测试你每周至少执行三次的重复移动端工作流程。记录出现的问题并提交GitHub issue——该项目正在积极寻求反馈,早期贡献者可直接影响产品路线图。