AI 博客精选 | 2026-04-17

今日概览

4月15-16日，AI 领域迎来密集发布：Anthropic 推出 Claude Opus 4.7，阿里 Qwen 发布 Qwen3.6-35B，Google 推出 Gemini 3.1 Flash TTS 语音模型。Simon Willison 用他标志性的"鹈鹕骑自行车"基准测试发现，本地运行的 Qwen3.6 竟然在图像生成上击败了 Claude Opus 4.7。与此同时，George Hotz 发布了 AI 驱动的中间人代理工具 zappa，Dwarkesh Patel 刊发了对 Jensen Huang 的深度访谈——这场对话围绕芯片供应链和地缘政治展开，信息量巨大。

精选文章

1. Qwen3.6-35B 在笔记本上画出比 Claude Opus 4.7 更好的鹈鹕

作者： Simon Willison | 博客： simonwillison.net
链接： 原文

Simon 用他自创的"pelican riding a bicycle"图像生成基准，对比了同日发布的 Qwen3.6-35B-A3B 和 Claude Opus 4.7。结果出乎意料：本地笔记本上运行的 Qwen 模型在图像质量上胜出。这不仅是一个有趣的基准测试，更暗示了开源小模型在特定任务上正在快速追赶甚至超越闭源巨头。MoE 架构（A3B 激活参数）让大模型在消费级硬件上变得可用，这个趋势值得关注。

2. zappa：AI 驱动的 mitmproxy

作者： George Hotz | 博客： geohot.github.io
链接： 原文

George Hotz 发布了 zappa——一个将 AI 代理嵌入中间人代理（mitmproxy）的工具。核心理念：当 AI 足以模拟人类与互联网交互时，用户可以部署 AI 代理来过滤、改写、优化网络流量，对抗注意力经济中的各种"收割"行为。这是一个将 AI agent 能力落地到基础设施层的激进尝试，技术思路和哲学立场都很有 Hotz 的风格。

3. Jensen Huang 访谈：TPU 竞争、对华芯片出口与 Nvidia 供应链护城河

作者： Dwarkesh Patel | 博客： dwarkesh.com
链接： 原文

Dwarkesh 与 Jensen Huang 的深度对话，覆盖了 Nvidia 的供应链能力（"如果我们未来几年要做万亿美元规模，我们有供应链支撑"）、TPU 竞争格局、以及为何应该向中国出售芯片的论证。Jensen 的论点很明确：限制出口不会阻止中国获得芯片，只会让 Nvidia 失去市场份额。这篇访谈是理解 AI 芯片地缘政治的必读材料。

4. llm-anthropic 0.25：支持 Claude Opus 4.7

作者： Simon Willison | 博客： simonwillison.net
链接： 原文

Simon 的 llm CLI 工具更新，第一时间支持了 Claude Opus 4.7，包括新的 thinking_effort: xhigh 模式和 thinking_display 控制选项。这反映了当前 LLM 工具链的一个趋势：thinking/reasoning 模式的细粒度控制正在成为标配，开发者需要决定在何时用何种推理深度。

5. Gary Marcus: Peak Absurdity, Part II

作者： Gary Marcus | 博客： garymarcus.substack.com
链接： 原文

Marcus 继续他的 AI 批判系列，标题"荒谬之巅 Part II"已说明一切。在行业乐观情绪高涨的一周里，Marcus 的逆向视角提供了必要的平衡。虽然内容细节需要阅读原文，但 Marcus 持续关注的核心议题——AI 能力的实际边界与营销叙事之间的落差——依然是行业健康讨论的重要组成部分。

6. Gemini 3.1 Flash TTS

作者： Simon Willison（报道 Google 发布）| 博客： simonwillison.net
链接： 原文

Google 发布了 Gemini 3.1 Flash TTS——一个可通过 prompt 指导的文本转语音模型。与传统 TTS 不同，你可以用自然语言描述想要的语音风格。这标志着 TTS 正在从"选择预设音色"向"用 prompt 定义一切"的范式转移，与 LLM 的交互模式趋同。

趋势洞察

1. 开源小模型在垂类任务上的逆袭。 Qwen3.6 用 MoE 架构在本地硬件上击败 Claude Opus，这不是孤例——开源模型的效率优化正在让"够用且免费"成为闭源模型的真正威胁。

2. AI Agent 深入基础设施层。 zappa 将 AI 代理嵌入网络代理层面，这标志着 Agent 从"对话式助手"向"系统级中间件"的演进。AI 不再只是被调用的工具，而是主动介入信息流的参与者。

3. 推理控制的精细化。 Claude Opus 4.7 引入 xhigh thinking effort，行业正在为不同场景提供不同推理深度——不是所有问题都需要最强推理，控制成本和延迟成为工程重点。

4. 多模态持续扩张。 TTS 模型开始支持 prompt 指导，图像生成被集成到通用 LLM 中。多模态不再是单独的模型类别，而是基础能力的标配。

5. 芯片地缘政治升温。 Jensen Huang 亲自下场论证对华出口的合理性，说明 AI 芯片的政治化程度已达到新高度。供应链能力正在成为比技术本身更深的护城河。

数据来源：8 个 AI 领域博主 RSS | 采集时间：2026-04-17 12:08 CST

📝 AI 博客精选