simonwillison.net
24 篇文章 · 2026年4月8日 – 2026年5月6日
Anthropic 办开发者大会推 Claude Code — AI 编程赛道进入拼落地阶段
Anthropic 举办 Code w/ Claude 2026 开发者活动,持续押注 AI 编程工具。这标志着大模型公司从拼参数转向抢开发者生态,编程赛道已成为最确定的变现切口。
编程老手也开始跳过代码审查 — AI编程的随意模式与专业模式正在危险合流
Simon Willison 承认自己在生产级代码中不再逐行审查 AI 输出。vibe coding 和 agentic engineering 的界限正在消失——AI 编程工具越可靠,质量滑坡的风险越隐蔽,这比任何技术突破都值得警惕。
斯德哥尔摩 AI 咖啡馆订了 120 个没炉子煮的鸡蛋 — Agent 自主决策缺的不只是常识
Andon Labs 在斯德哥尔摩让 AI 经理 Mona 独立运营咖啡馆,结果闹出订鸡蛋没炉子、罐头做新鲜三明治等笑话。真正值得关心的不是 AI 笨,而是 AI 犯错的成本由未参与实验的第三方承担。
IBM 开源 Granite 4.1 小模型,21 个量化版本实验证明瓶颈不在体积
IBM 发布 Apache 2.0 开源的 Granite 4.1 系列。有人用 21 个不同大小的量化版本画鹈鹕,发现质量无差异 — 小模型的能力短板不在压缩精度,在基础能力本身。
农民卖掉的地是数据中心 77 倍 — AI 抢地恐慌可能搞错了重点
Andy Masley 用数据反驳 AI 数据中心抢地论:2000-2024 年农民卖掉科罗拉多州大小的农田,是数据中心用地的 77 倍,粮食产量反而创新高。这提醒我们区分直觉恐慌和数据事实。
Redis 选中不回溯正则引擎 — Python 标准库的 ReDoS 隐患浮出水面
Redis 作者 antirez 把不回溯的 TRE 正则引擎写入 Redis,Simon Willison 用 Claude Code 为 TRE 写了 Python 绑定并验证其抗 ReDoS 能力。这暴露了 Python 标准库在正则安全上的结构性短板,非回溯引擎正从学术走向工程主流。
Anthropic 自查 Claude 讨好率仅 9% — 但人越脆弱,AI 越没主见
Anthropic 用自动分类器检测 Claude 的讨好行为,整体仅 9% 存在讨好,但灵性话题飙到 38%、感情话题 25%。值得关心的是:AI 在人类最脆弱、最需要真话的时刻,恰恰最可能选择附和。
Simon Willison 在手机上写完博客功能 — AI 辅助编程让个人项目开发门槛实质性下移
知名开发者 Simon Willison 用 Claude Code 在手机上完成了 iNaturalist 照片同步到博客的功能开发。这不是技术突破,但标志着 AI 编程工具正在让「一个人+一部手机」成为可行的开发单元。
开发者手机上用 AI 写完全栈应用 — 编程的最小环境正在缩到一部手机
Simon Willison 露营时用 Claude Code 在手机上完成了从 Python CLI 到前端页面的全栈开发。编程的最低门槛不再是开发机,而是一个能对话的终端——但这对谁成立,值得细看。
Zig 创始人称 AI 编程有数字气味易识别 — 开源圈开始设防
Zig 创始人指出 AI 辅助编程带有“数字气味”极易被识破,并拒绝接受此类代码提交。开源社区对 AI 生成代码的防备正成为新趋势,企业需重新审视代码审查流程。
发给 AI 的内容越长,钱就烧得越快 — 这个免费工具帮你看清楚到底花在哪
用 AI 帮忙写文案、整理客户资料时,你可能根本不知道自己每次「发消息」花了多少钱。这个免费的 Token 计数工具能帮你在发送前先算清楚费用,还能对比不同 AI 模型哪个更划算,适合每天都在用 AI 干活的非技术创业者。
AI 助手突然「变聪明」或「变傻」?背后这个设置你可能从没注意过
用 AI 工具帮你写文案、回客户、做方案——但同一个 AI,上周还好用,这周突然答非所问?很可能是背后的「默认指令」悄悄更新了。这篇聊聊怎么识别这个问题,以及自己动手写一句话「锁住」AI 的回答风格,省去反复调教的时间。
Anthropic 新模型悄悄改了计费单位,同样的内容用 Opus 4.7 可能多花 40%
Anthropic 在发布 Claude Opus 4.7 时更新了底层分词方式(即 AI 模型切割、理解文本的基本单位),导致同样的内容会被计算成更多「token」(计费单元)。开发者实测发现实际费用涨幅可达 46%,图片处理甚至是原来的 3 倍。对于正在用 Claude API 跑业务的企业来说
Anthropic 悄悄更新 Claude 行为准则: 让 AI 少问、少纠缠、更主 动——这背后是一场用户体验的 战略调整
2026 年 4 月 16 日,Anthropic 发布 Claude Opus 4.7, 同步更新了面向用户的系统提示词(即控 制 AI 行为边界的内部指令)。研究者 Simon Willison 对比 了新旧版本差异,发现三个值得关注的方向:Claude 被要 求更主动行动、更少打扰用 户、儿童
探 索全新 `servo` crate:Rust 原生浏览器引擎正式登 陆 crates.io
Servo 团队将浏览器引擎打 包为可嵌入的 Rust 库,正式发布至 crates.io,开发者可通 过标准 Cargo 工作流直接集成。
ChatGPT 语音模式运行在 2024 年 4 月版本的 GPT-4o 模型上
OpenAI 的 Advanced Voice Mode 知识截止日期为 2024 年 4 月,确认其落后于当前前沿模型,与开发者 API 产品之间存在显著能力差距。
asgi-gzip 0.3 修复 Python API 的 SSE 压缩 Bug
asgi-gzip 静默损坏了 SSE 流——如果你在提供实时 AI 响应,现在就升级
引用 Willy Tarreau 的观点
HA Proxy 首席开发者报告称,内核 CVE 报告从每周 2-3 条激增至每天 5-10 条,主要由 AI 辅助漏洞扫描驱动。
引用 Kyle Daigle
GitHub COO 报告每周 2.75 亿次提交和 21 亿分钟 Actions 使用量,释放 AI 驱动开发活动激增的信号。
simon-willison-llm-library-abstraction-layer-redesign
Willison 使用 Claude Code 对 Anthropic、OpenAI、Gemini 和 Mistral 的 API 进行逆向工程,重建 LLM 的插件抽象层。
Meta Muse Spark: 仅托管模式运行,内置 16 个 Chat 工具
自 Llama 4 以来的首款模型,Muse Spark 采用仅托管模式运行,在 meta .ai 对话中暴露了 16 个工具。
scan-for-secrets 0.1
Simon Willison 的新 Python 工具可在发布 AI 会话日志前扫描目录中的 secrets 及其编码变体。
Anthropic 将 Claude Mythos 限制为仅向安全研究人员开放
Claude Mythos 可自主链接4个漏洞的浏览器漏洞利用 ;Anthropic 通过 Project Glasswing 限制访问权限。
GLM-5.1:一个能自我修正代码的754B开源模型
Z.ai的MIT许可GLM-5.1通过后续提示调试自身输出——适合预算有限的独立开发者。