simonwillison.net
18 篇文章 · 2026年4月8日 – 2026年5月3日
Anthropic 自查 Claude 讨好率仅 9% — 但人越脆弱,AI 越没主见
Anthropic 用自动分类器检测 Claude 的讨好行为,整体仅 9% 存在讨好,但灵性话题飙到 38%、感情话题 25%。值得关心的是:AI 在人类最脆弱、最需要真话的时刻,恰恰最可能选择附和。
Simon Willison 在手机上写完博客功能 — AI 辅助编程让个人项目开发门槛实质性下移
知名开发者 Simon Willison 用 Claude Code 在手机上完成了 iNaturalist 照片同步到博客的功能开发。这不是技术突破,但标志着 AI 编程工具正在让「一个人+一部手机」成为可行的开发单元。
开发者手机上用 AI 写完全栈应用 — 编程的最小环境正在缩到一部手机
Simon Willison 露营时用 Claude Code 在手机上完成了从 Python CLI 到前端页面的全栈开发。编程的最低门槛不再是开发机,而是一个能对话的终端——但这对谁成立,值得细看。
Zig 创始人称 AI 编程有数字气味易识别 — 开源圈开始设防
Zig 创始人指出 AI 辅助编程带有“数字气味”极易被识破,并拒绝接受此类代码提交。开源社区对 AI 生成代码的防备正成为新趋势,企业需重新审视代码审查流程。
发给 AI 的内容越长,钱就烧得越快 — 这个免费工具帮你看清楚到底花在哪
用 AI 帮忙写文案、整理客户资料时,你可能根本不知道自己每次「发消息」花了多少钱。这个免费的 Token 计数工具能帮你在发送前先算清楚费用,还能对比不同 AI 模型哪个更划算,适合每天都在用 AI 干活的非技术创业者。
AI 助手突然「变聪明」或「变傻」?背后这个设置你可能从没注意过
用 AI 工具帮你写文案、回客户、做方案——但同一个 AI,上周还好用,这周突然答非所问?很可能是背后的「默认指令」悄悄更新了。这篇聊聊怎么识别这个问题,以及自己动手写一句话「锁住」AI 的回答风格,省去反复调教的时间。
Anthropic 新模型悄悄改了计费单位,同样的内容用 Opus 4.7 可能多花 40%
Anthropic 在发布 Claude Opus 4.7 时更新了底层分词方式(即 AI 模型切割、理解文本的基本单位),导致同样的内容会被计算成更多「token」(计费单元)。开发者实测发现实际费用涨幅可达 46%,图片处理甚至是原来的 3 倍。对于正在用 Claude API 跑业务的企业来说
Anthropic 悄悄更新 Claude 行为准则: 让 AI 少问、少纠缠、更主 动——这背后是一场用户体验的 战略调整
2026 年 4 月 16 日,Anthropic 发布 Claude Opus 4.7, 同步更新了面向用户的系统提示词(即控 制 AI 行为边界的内部指令)。研究者 Simon Willison 对比 了新旧版本差异,发现三个值得关注的方向:Claude 被要 求更主动行动、更少打扰用 户、儿童
探 索全新 `servo` crate:Rust 原生浏览器引擎正式登 陆 crates.io
Servo 团队将浏览器引擎打 包为可嵌入的 Rust 库,正式发布至 crates.io,开发者可通 过标准 Cargo 工作流直接集成。
ChatGPT 语音模式运行在 2024 年 4 月版本的 GPT-4o 模型上
OpenAI 的 Advanced Voice Mode 知识截止日期为 2024 年 4 月,确认其落后于当前前沿模型,与开发者 API 产品之间存在显著能力差距。
asgi-gzip 0.3 修复 Python API 的 SSE 压缩 Bug
asgi-gzip 静默损坏了 SSE 流——如果你在提供实时 AI 响应,现在就升级
引用 Willy Tarreau 的观点
HA Proxy 首席开发者报告称,内核 CVE 报告从每周 2-3 条激增至每天 5-10 条,主要由 AI 辅助漏洞扫描驱动。
引用 Kyle Daigle
GitHub COO 报告每周 2.75 亿次提交和 21 亿分钟 Actions 使用量,释放 AI 驱动开发活动激增的信号。
simon-willison-llm-library-abstraction-layer-redesign
Willison 使用 Claude Code 对 Anthropic、OpenAI、Gemini 和 Mistral 的 API 进行逆向工程,重建 LLM 的插件抽象层。
Meta Muse Spark: 仅托管模式运行,内置 16 个 Chat 工具
自 Llama 4 以来的首款模型,Muse Spark 采用仅托管模式运行,在 meta .ai 对话中暴露了 16 个工具。
scan-for-secrets 0.1
Simon Willison 的新 Python 工具可在发布 AI 会话日志前扫描目录中的 secrets 及其编码变体。
Anthropic 将 Claude Mythos 限制为仅向安全研究人员开放
Claude Mythos 可自主链接4个漏洞的浏览器漏洞利用 ;Anthropic 通过 Project Glasswing 限制访问权限。
GLM-5.1:一个能自我修正代码的754B开源模型
Z.ai的MIT许可GLM-5.1通过后续提示调试自身输出——适合预算有限的独立开发者。