本日报由 AI 自动收集于 2026-07-02T06:00+08:00,覆盖日期:2026-07-01
📌 今日要点
- Claude Sonnet 5 正式发布并成 Claude Code 默认模型:原生 1M token 上下文,促销价 $2/$10 per Mtok 至 8 月 31 日,性能逼近 Opus 4.8 但成本仅约 60%。
- Claude Code 连更两版:v2.1.197 带来 Sonnet 5;v2.1.198 跟进 Claude in Chrome GA、后台 Agent 自动 commit/push/开 draft PR、
/dataviz技能、子 Agent 继承 extended thinking 等。 - Anthropic 推出 Claude Science:面向科学家的 AI 工作台,集成 60 多个科学数据库与 NVIDIA BioNeMo Agent Toolkit,支持文献分析、实验执行、可复现图表与论文生成。
- OpenAI reportedly 将访客版 ChatGPT 推理成本削减过半:需用 Nvidia GPU 数量降至“仅几百块”,显示推理层优化仍有巨大空间。
- GPTNT 新基准暴露 AI 实时协作短板:基于《Keep Talking and Nobody Explodes》游戏,当前所有前沿模型均无法实时成功拆弹,协作仍是待攻克难题。
🤖 Claude Code 实战
写代码
- Claude Sonnet 5 成为默认模型:更新到 v2.1.197 即可在 Claude Code 中使用
claude-sonnet-5,1M 上下文让长代码库、多步骤 agent 任务更稳定 — Anthropic - v2.1.198 子 Agent 继承 extended thinking:委托任务时子 Agent 自动继承主会话的推理配置,复杂推理链输出质量更高 — GitHub CHANGELOG
- v2.1.198 后台 Agent 自动提交 PR:后台 Agent 完成代码工作后会自动 commit、push 并打开 draft PR,省去人工收尾 — GitHub CHANGELOG
- v2.1.198 新增
/dataviz技能:用于图表与仪表盘设计指导,附带可运行调色板验证器 — GitHub CHANGELOG - Sonnet 5 编码基准:SWE-Bench Pro 63.2%(Sonnet 4.6 为 58.1%)、CursorBench v3.1 61.2%(+12.2%)、Terminal-Bench 2.1 80.4% — AI Release Tracker
Review
- 后台 Agent 通知钩子:v2.1.198 中
claude agents需要输入或已完成时会触发Notificationhook(agent_needs_input/agent_completed),适合接入企业通知工作流 — GitHub CHANGELOG - Claude Science 内置 reviewer agent:科研场景中专门检查引用与计算结果,可标记并修正错误,为代码审查提供了跨领域参考范式 — Anthropic
- v2.1.198 安全模式
--safe-mode:启动时禁用 CLAUDE.md、plugins、skills、hooks、MCP servers,便于排查到底是哪个自定义层导致问题 — GitHub CHANGELOG
写方案
- Claude Science 的“协调 agent + 专家 agent”模式:通用协调 agent 能 spawn 专家 agent 并调用 60+ 科学技能,适合借鉴到业务方案设计中的多 agent 分层架构 — Anthropic
- v2.1.198 移除
/agents向导:改为直接让 Claude 创建或管理子 Agent,或手动编辑.claude/agents/,说明 Anthropic 希望子 Agent 从“向导式”走向“声明式/代码式” — GitHub CHANGELOG - Claude in Chrome 正式可用:v2.1.198 GA,浏览器端 Claude Code 进入稳定期,方案演示与协作门槛进一步降低 — GitHub CHANGELOG
🛠 Skill & MCP 新动态
新增 Skill
- Claude Code 内置
/dataviz技能:v2.1.198 新增,专注图表与仪表盘设计,附带调色板验证器 — GitHub CHANGELOG - Claude Science 预置 60+ 科学技能:覆盖基因组学、单细胞、蛋白质组学、结构生物学、化学信息学等,可直接通过自然语言调用 — Anthropic
- NVIDIA BioNeMo Agent Toolkit 技能集:作为 Claude Science 的原生连接器,提供 Evo 2、Boltz-2、OpenFold3 等生命科学模型能力 — NVIDIA Blog
- 今日其他新增 Skill 无显著重大发布:主要增量来自 Anthropic 官方与 NVIDIA 生态集成。
新增 MCP
- X 官方托管 MCP Server:AI 工具(Claude/Cursor/Grok Build 等)可直接访问 X API 进行搜索、读帖、查用户、分析趋势,只读模式不支持 Write API — TechCrunch
- NVIDIA BioNeMo Agent Toolkit MCP:让任意 agent 接入蛋白质折叠、分子对接、生成化学、基因组分析等生命科学能力 — GitHub
- Claude Science 连接科学数据库:通过 MCP/connector 接入 UniProt、PDB、Ensembl、Reactome、ChEMBL、GEO 等 60+ 数据源 — Anthropic
新玩法
- Claude Science + BioNeMo 端到端科研:从文献分析、实验设计、计算执行到可复现图表/论文生成, reviewer agent 全程校验引用与计算 — Anthropic
- 后台 Agent 自动开 PR 工作流:v2.1.198 让后台 Agent 变成“异步外包工程师”,适合夜间批量重构、文档生成等任务 — GitHub CHANGELOG
- X MCP 只读舆情监控:结合 Claude Code / Cursor 可做实时 X 话题追踪、竞品动态、技术趋势扫描,但无法自动发帖避免滥用 — TechCrunch
- Claude Science 可 fork 会话:不同方案可并行对比不丢失原线程,适合科研 A/B 实验设计 — Anthropic
- Sonnet 5 长上下文 + agent 任务:1M token 让长任务保留完整过程状态(修改过哪些文件、跑过哪些命令、失败过哪些方案),减少上下文截断导致的 agent 迷失 — 腾讯新闻
🔥 热门文章 & 仓库
热门文章
- Introducing Claude Sonnet 5 — Anthropic 官方发布:Sonnet 系列最强 agentic 模型,1M 上下文,性能逼近 Opus 4.8,成本仅约 60%。
- Claude Science, an AI workbench for scientists — 面向科学家的 AI 工作台,集成 60+ 数据库与 NVIDIA BioNeMo,beta 面向 Pro/Max/Team/Enterprise。
- Claude Sonnet 5 发布,性能接近 Opus 4.8,价格只有 60% — 中文深度解读:SWE-Bench Pro 63.2%、Humanity’s Last Exam 43.2%(无工具)/ 57.4%(有工具)、OSWorld-Verified 81.2%。
- OpenAI reportedly cut response costs for guest ChatGPT users by more than half — The Information 报道:访客版 ChatGPT 推理成本减半,GPU 用量降至“几百块”。
- GPTNT: Benchmarking Real-Time Collaboration Between Multimodal Agents — 基于拆弹合作游戏的实时协作基准,当前前沿模型均无法实时成功拆弹。
- California partners with Anthropic for state AI — 加州州政府与 Anthropic 达成协议,州机构半价使用 Claude。
- Anthropic and Gov. Newsom forge deal allowing California government to use Claude at half-price — TechCrunch 解读:Anthropic 与加州关系加深,联邦政府态度趋紧。
- NVIDIA BioNeMo Agent Toolkit 接入 Claude Science — IT之家:前 20 大药企已有 18 家使用 BioNeMo,英伟达工具集加速生命科学 AI 研究。
- Claude Code v2.1.198 changelog — Claude in Chrome GA、后台 Agent 自动 PR、
/dataviz技能、子 Agent 继承 extended thinking 等。 - X launches hosted MCP server — X 官方 MCP 让 Claude/Cursor/Grok Build 等直接调用 X API,只读模式。
热门仓库
- msitarzewski/agency-agents — 完整 AI 代理集合,每个代理具备专属人格、流程与交付标准,可一键安装到 Claude Code / Cursor(⭐ 121.7k,今日 +1.8k)
- obra/superpowers — subagent 驱动的软件开发方法论与技能框架,强调先确认需求与规格再让子代理执行(⭐ 243.1k,今日 +890)
- browser-use/video-use — browser-use 团队新作,用自然语言驱动编码代理完成视频剪辑(⭐ 12.9k,今日 +721)
- HKUDS/Vibe-Trading — 个人 AI 量化交易代理,支持回测、影子账户、MCP/API 对接(⭐ 16.1k,今日 +721)
- xbtlin/ai-berkshire — 基于 Claude Code / Codex 的价值投资研究框架,四大师方法论 + 多 Agent 对抗分析(⭐ 7.9k,今日 +969)
- usestrix/strix — 开源 AI 渗透测试工具,多智能体动态运行目标代码验证漏洞(⭐ 28.5k,今日 +515)
- ogulcancelik/herdr — 终端里的 agent 多工复用器,兼容 TUI 渲染与 SSH 跨设备重连(⭐ 9.3k,今日 +486)
- google/agents-cli — Google 的 Agent CLI 与技能集,把编码助手变成 Google Cloud 上的 AI 代理开发专家(⭐ 4.5k,今日 +445)
- diegosouzapw/OmniRoute — 统一 AI 网关,接入 231+ 提供商(50+ 免费),支持 Claude Code/Cursor/Codex/Cline/Copilot,RTK+Caveman 压缩节省 15-95% token(⭐ 9.0k,今日 +387)
- facebook/astryx — Meta 开源设计系统,完全可定制且“agent ready”,超 13000 个内部应用支撑(⭐ 2.1k,今日 +364)
🎯 明日选题建议
- Claude Science 科研工作流实测:从文献综述、蛋白质结构预测到图表生成的完整 agent 流水线,如何评估结果可信度与可复现性。
- Sonnet 5 在 Claude Code 中的长上下文实战:1M token 下的大型代码库重构、多文件联调与 agent 记忆管理技巧。
- GPTNT 协作基准的启示:当前 AI 在实时信息不对称、时间压力下的协作短板,对 multi-agent 系统设计有哪些工程改进方向。
本资讯由 AI 自动收集与整理。