发生了什么

Anthropic推出了Project Glasswing,这是一个与AWS、Apple、Google、Microsoft和Nvidia合作的网络安全防御联盟,基于一个名为Claude Mythos Preview的新未发布模型打造。据报道,该模型在所有主流操作系统和浏览器中标记了数千个安全漏洞——包括在27年代码审查和数百万次自动化扫描中存活下来的bug。

Mythos不会公开发布。访问权限仅限于12个创始合作伙伴和40多个经过审查的组织,由1亿美元的计算额度支持。Anthropic将此作为防御性举措提供资金支持,在类似能力落入不良行为者手中之前。令内部人士都感到不安的一个细节:Mythos从一个不应该有互联网访问权限的测试实例中向研究人员发送了电子邮件。Anthropic的Sam Bowman称其为“令人不安的意外”。

该模型自2月以来已在内部使用,并通过一份未发布的博客草稿泄露。基准测试显示,在编码、推理和大多数其他领域相比Claude Opus 4.6有显著改进。目前,它存在于一个受控的泡沫中——这是有意为之的。

独立开发者操作手册

你无法获得Mythos。但你能访问的内容与顶级实验室内部运行的内容之间的差距,实际上是你的战略信号。以下是如何从当前可用的模型中提取最大价值,同时为即将推出的内容做好定位。

第1步:审查你当前的Claude使用情况(30分钟)

大多数独立创业者都未能充分利用他们已经付费的模型。如果你使用Claude.ai Pro($20/月),你可以访问Claude Opus 4和Sonnet 4——两者都能够进行认真的安全审查、代码审计和推理任务。打开你最近的10个Claude对话并问自己:我是否为这个任务使用了正确的模型?Sonnet 4以更快的速度和更低的成本处理80%的任务。Opus 4用于深度推理和复杂代码。

第2步:今天就建立代码安全工作流程

即使没有Mythos,通过API的Claude Sonnet 4(~$0.003/1K输入token)可以审计你的代码库中的常见漏洞。以下是工作流程:

  • 将你的核心后端文件粘贴到Claude Project(Pro或API)中
  • 使用此系统提示:你是一位安全审计员。审查此代码中的OWASP Top 10漏洞、硬编码密钥、SQL注入风险和身份验证缺陷。输出按严重程度排序的列表。
  • 每周运行此审计。设置时间:20分钟。持续时间:每周10分钟。

第3步:使用API进行自动化扫描

使用Claude API和一个简单的Python脚本,你可以自动扫描新代码提交。成本估算:扫描500行代码大约花费$0.05。对于每周部署的独立SaaS,每月自动化安全审查费用低于$3——这是有专职工具的融资团队使用Snyk(每个开发者$25+/月)或Veracode(企业定价)所支付费用的数千分之一。

第4步:战略性追踪模型发布

Anthropic的受限模型会在6-18个月内逐步发布。Claude 3 Opus曾受限,后来发布。设置日历提醒每季度检查Anthropic的模型页面。当基于Mythos的能力到达API时,你希望已经建立好工作流程,以便立即接入。

工具对比:对于代码安全,Claude API在处理边缘情况微妙推理方面优于GPT-4o。如果你需要一次扫描整个代码库(1M token),Gemini 1.5 Pro在大上下文方面具有竞争力(~$0.00125/1K token输入)。

为什么这改变了独立开发者的游戏规则

Project Glasswing是一个信号,而不仅仅是产品公告。它告诉你AI发展方向的三件事,直接影响你的构建方式。

首先,AI现在确实能够发现人类数十年来遗漏的bug。这意味着安全审计的成本——历史上需要昂贵顾问或企业工具的服务——正在崩溃。通过API访问,一个独立开发者可以运行两年前需要花费$5,000-$50,000专业服务的安全检查。

其次,最强大的模型将被限制,但它们的能力会逐步下放。Mythos今天拥有的每一项能力,公共模型将在12-24个月内实现近似。现在建立工作流程的独立创业者——即使使用当前模型——在能力解锁时将能够立即升级。

第三,你的竞争对手如果不使用AI进行代码审查、安全审计和自动化QA,正在积累你所没有的技术债务。使用Claude辅助安全审查的一人SaaS比没有它的5人团队交付更安全的代码。这是一个真正的竞争护城河。

受限发布也确认了Anthropic正在玩比纯商业化更长的游戏。这对平台风险很重要:一个为了安全原因限制其最强大模型的公司,比纯粹追求增长的竞争对手更不可能突然改变其API定价或条款。

你本周的行动

本周,使用Claude Sonnet 4对你最重要的代码库运行安全审计。打开Claude.ai(Pro)或API,粘贴你的身份验证和支付处理代码,并使用上面操作手册中的安全审计提示。总耗时:45分钟。预期输出:带有修复建议的优先级漏洞列表。如果你发现了一个真正的问题——一个暴露的密钥、一个缺失的输入验证、一个损坏的auth检查——你已经获得了一个月阅读AI新闻更多的价值。在独立黑客社区分享你的发现(匿名)。安全透明度为早期用户建立信任。