AI 博客精选 — 2026年4月19日
今日概览
本周 AI 博客圈最值得关注的是 Claude Opus 4.7 的发布——Simon Willison 连续多篇文章围绕其 system prompt 变化展开深度拆解,并以独特的 git timeline 方式可视化 Anthropic 的 system prompt 演进史。与此同时,Qwen3.6-35B-A3B 以轻量级模型在 Simon 的「鹈鹕骑自行车」基准测试中意外击败了 Claude Opus 4.7,引发对小型模型能力的重新审视。George Hotz 则从 AI 技术圈跳出来发表了两篇关于美国政治经济的宏大叙事文章。
精选文章
1. Changes in the system prompt between Claude Opus 4.6 and 4.7
作者: Simon Willison | 来源: simonwillison.net
Anthropic 是目前唯一公开 chat system prompt 的主流 AI 实验室。Simon 逐字对比了 Opus 4.6 到 4.7 之间的 system prompt 变化,揭示了 Anthropic 如何微调模型的行为边界和指令遵循策略。对于理解大模型「背后那层隐形指令」的演进逻辑,这是不可多得的一手资料。
为什么值得读: System prompt 是理解 AI 产品行为的关键黑盒。Anthropic 的透明度让这种分析成为可能,而 Simon 的拆解做得极其细致。
2. Claude system prompts as a git timeline
作者: Simon Willison | 来源: simonwillison.net
Simon 将 Anthropic 自 Claude 3 以来发布的所有 system prompt 提取为 git 仓库,以版本控制的方式呈现每一次修改。这不仅是技术工具,更是一部 AI 产品迭代的可视化编年史。
为什么值得读: 极其巧妙的思路——用开发者最熟悉的 git diff 来理解 AI 公司的产品决策演变。对产品经理和安全研究者都有参考价值。
3. Qwen3.6-35B-A3B on my laptop drew me a better pelican than Claude Opus 4.7
作者: Simon Willison | 来源: simonwillison.net
Simon 用他自创的「鹈鹕骑自行车」SVG 绘图基准,对比了同一天发布的 Qwen3.6-35B-A3B 和 Claude Opus 4.7。结果出人意料——这个能在笔记本上本地运行的小模型,在视觉生成质量上击败了顶级闭源模型。当然这只是一个小测试,但它指向了一个趋势:开源小模型在某些具体任务上已经不容小觑。
为什么值得读: 虽然鹈鹕测试不能代表全面能力,但它以一种直观有趣的方式揭示了 AI 能力的分布正在变得更加扁平。
4. Adding a new content type to my blog-to-newsletter tool
作者: Simon Willison | 来源: simonwillison.net
Simon 分享了他用 LLM 辅助开发的一个实例:给博客转 newsletter 工具添加新内容类型。文章展示了如何用一个看似简短的 prompt 让 AI 完成大量一次性编码工作,是他「Agentic Engineering Patterns」系列的最新一篇。
为什么值得读: 实战案例比任何理论框架都更有说服力。展示了 agentic coding 的真实工作流和效率。
5. llm-anthropic 0.25 — 支持 Claude Opus 4.7
作者: Simon Willison | 来源: simonwillison.net
Simon 的开源工具 llm-anthropic 发布 0.25 版本,新增对 claude-opus-4.7 的支持,包括 thinking_effort: xhigh 和新的 thinking_display 选项。对于使用 LLM CLI 工具链的开发者来说,这是跟进最新模型能力的快捷方式。
为什么值得读: Simon 的 llm 工具生态是 AI 开发者工具链的重要组成,关注其更新等于跟上模型能力的最前沿。
6. America lost the Mandate of Heaven / Five Simple Steps to Fix America
作者: George Hotz | 来源: geohot.github.io
George Hotz(tinygrad 创始人)突然转向政治经济领域,以「天命」的东方概念分析美国的国家竞争力,并提出五步修复方案。虽然与 AI 技术无直接关联,但反映了顶尖 AI 工程师对宏观环境的深层思考。
为什么值得读: 了解 AI 行业核心人物的世界观,有时比技术本身更重要。
趋势洞察
-
System Prompt 透明度成为竞争优势: Anthropic 持续公开 system prompt,而 Simon 的深度分析表明这不仅是公关行为——它实际上在构建一个研究生态。这给其他实验室(OpenAI、Google)施加了透明度压力。
-
开源小模型的「垂直突围」: Qwen3.6-35B-A3B 在特定任务上击败顶级闭源模型,印证了一个趋势——模型能力的天花板在抬升的同时,小模型在特定场景的「性价比」正在超越大模型。MoE 架构(A3B 激活参数)是关键推手。
-
Agentic Engineering 的实践化: Simon 持续输出 agentic coding 的实战模式,从系统设计到 prompt 工程。这不是未来趋势,而是正在发生的工作方式变革。
-
AI 从业者的视野外延: George Hotz 从技术转向政治经济叙事,反映了 AI 行业核心人物对技术之外的社会结构问题的关注——这个信号值得注意。
数据来源:8 个 AI 博客 RSS 源 | 采集时间:2026-04-19 12:06 CST