AI 博客精选 | 2026-04-17
今日概览
4月15-16日,AI 领域迎来密集发布:Anthropic 推出 Claude Opus 4.7,阿里 Qwen 发布 Qwen3.6-35B,Google 推出 Gemini 3.1 Flash TTS 语音模型。Simon Willison 用他标志性的"鹈鹕骑自行车"基准测试发现,本地运行的 Qwen3.6 竟然在图像生成上击败了 Claude Opus 4.7。与此同时,George Hotz 发布了 AI 驱动的中间人代理工具 zappa,Dwarkesh Patel 刊发了对 Jensen Huang 的深度访谈——这场对话围绕芯片供应链和地缘政治展开,信息量巨大。
精选文章
1. Qwen3.6-35B 在笔记本上画出比 Claude Opus 4.7 更好的鹈鹕
作者: Simon Willison | 博客: simonwillison.net
链接: 原文
Simon 用他自创的"pelican riding a bicycle"图像生成基准,对比了同日发布的 Qwen3.6-35B-A3B 和 Claude Opus 4.7。结果出乎意料:本地笔记本上运行的 Qwen 模型在图像质量上胜出。这不仅是一个有趣的基准测试,更暗示了开源小模型在特定任务上正在快速追赶甚至超越闭源巨头。MoE 架构(A3B 激活参数)让大模型在消费级硬件上变得可用,这个趋势值得关注。
2. zappa:AI 驱动的 mitmproxy
作者: George Hotz | 博客: geohot.github.io
链接: 原文
George Hotz 发布了 zappa——一个将 AI 代理嵌入中间人代理(mitmproxy)的工具。核心理念:当 AI 足以模拟人类与互联网交互时,用户可以部署 AI 代理来过滤、改写、优化网络流量,对抗注意力经济中的各种"收割"行为。这是一个将 AI agent 能力落地到基础设施层的激进尝试,技术思路和哲学立场都很有 Hotz 的风格。
3. Jensen Huang 访谈:TPU 竞争、对华芯片出口与 Nvidia 供应链护城河
作者: Dwarkesh Patel | 博客: dwarkesh.com
链接: 原文
Dwarkesh 与 Jensen Huang 的深度对话,覆盖了 Nvidia 的供应链能力("如果我们未来几年要做万亿美元规模,我们有供应链支撑")、TPU 竞争格局、以及为何应该向中国出售芯片的论证。Jensen 的论点很明确:限制出口不会阻止中国获得芯片,只会让 Nvidia 失去市场份额。这篇访谈是理解 AI 芯片地缘政治的必读材料。
4. llm-anthropic 0.25:支持 Claude Opus 4.7
作者: Simon Willison | 博客: simonwillison.net
链接: 原文
Simon 的 llm CLI 工具更新,第一时间支持了 Claude Opus 4.7,包括新的 thinking_effort: xhigh 模式和 thinking_display 控制选项。这反映了当前 LLM 工具链的一个趋势:thinking/reasoning 模式的细粒度控制正在成为标配,开发者需要决定在何时用何种推理深度。
5. Gary Marcus: Peak Absurdity, Part II
作者: Gary Marcus | 博客: garymarcus.substack.com
链接: 原文
Marcus 继续他的 AI 批判系列,标题"荒谬之巅 Part II"已说明一切。在行业乐观情绪高涨的一周里,Marcus 的逆向视角提供了必要的平衡。虽然内容细节需要阅读原文,但 Marcus 持续关注的核心议题——AI 能力的实际边界与营销叙事之间的落差——依然是行业健康讨论的重要组成部分。
6. Gemini 3.1 Flash TTS
作者: Simon Willison(报道 Google 发布)| 博客: simonwillison.net
链接: 原文
Google 发布了 Gemini 3.1 Flash TTS——一个可通过 prompt 指导的文本转语音模型。与传统 TTS 不同,你可以用自然语言描述想要的语音风格。这标志着 TTS 正在从"选择预设音色"向"用 prompt 定义一切"的范式转移,与 LLM 的交互模式趋同。
趋势洞察
1. 开源小模型在垂类任务上的逆袭。 Qwen3.6 用 MoE 架构在本地硬件上击败 Claude Opus,这不是孤例——开源模型的效率优化正在让"够用且免费"成为闭源模型的真正威胁。
2. AI Agent 深入基础设施层。 zappa 将 AI 代理嵌入网络代理层面,这标志着 Agent 从"对话式助手"向"系统级中间件"的演进。AI 不再只是被调用的工具,而是主动介入信息流的参与者。
3. 推理控制的精细化。 Claude Opus 4.7 引入 xhigh thinking effort,行业正在为不同场景提供不同推理深度——不是所有问题都需要最强推理,控制成本和延迟成为工程重点。
4. 多模态持续扩张。 TTS 模型开始支持 prompt 指导,图像生成被集成到通用 LLM 中。多模态不再是单独的模型类别,而是基础能力的标配。
5. 芯片地缘政治升温。 Jensen Huang 亲自下场论证对华出口的合理性,说明 AI 芯片的政治化程度已达到新高度。供应链能力正在成为比技术本身更深的护城河。
数据来源:8 个 AI 领域博主 RSS | 采集时间:2026-04-17 12:08 CST