AI 资讯 - 2026-07-01

本日报由 AI 自动收集于 2026-07-02T06:00+08:00，覆盖日期：2026-07-01

📌 今日要点

Claude Sonnet 5 正式发布并成 Claude Code 默认模型：原生 1M token 上下文，促销价 $2/$10 per Mtok 至 8 月 31 日，性能逼近 Opus 4.8 但成本仅约 60%。
Claude Code 连更两版：v2.1.197 带来 Sonnet 5；v2.1.198 跟进 Claude in Chrome GA、后台 Agent 自动 commit/push/开 draft PR、/dataviz 技能、子 Agent 继承 extended thinking 等。
Anthropic 推出 Claude Science：面向科学家的 AI 工作台，集成 60 多个科学数据库与 NVIDIA BioNeMo Agent Toolkit，支持文献分析、实验执行、可复现图表与论文生成。
OpenAI reportedly 将访客版 ChatGPT 推理成本削减过半：需用 Nvidia GPU 数量降至“仅几百块”，显示推理层优化仍有巨大空间。
GPTNT 新基准暴露 AI 实时协作短板：基于《Keep Talking and Nobody Explodes》游戏，当前所有前沿模型均无法实时成功拆弹，协作仍是待攻克难题。

Claude Sonnet 5 成为默认模型：更新到 v2.1.197 即可在 Claude Code 中使用 claude-sonnet-5，1M 上下文让长代码库、多步骤 agent 任务更稳定 — Anthropic
v2.1.198 子 Agent 继承 extended thinking：委托任务时子 Agent 自动继承主会话的推理配置，复杂推理链输出质量更高 — GitHub CHANGELOG
v2.1.198 后台 Agent 自动提交 PR：后台 Agent 完成代码工作后会自动 commit、push 并打开 draft PR，省去人工收尾 — GitHub CHANGELOG
v2.1.198 新增 /dataviz 技能：用于图表与仪表盘设计指导，附带可运行调色板验证器 — GitHub CHANGELOG
Sonnet 5 编码基准：SWE-Bench Pro 63.2%（Sonnet 4.6 为 58.1%）、CursorBench v3.1 61.2%（+12.2%）、Terminal-Bench 2.1 80.4% — AI Release Tracker

后台 Agent 通知钩子：v2.1.198 中 claude agents 需要输入或已完成时会触发 Notification hook（agent_needs_input / agent_completed），适合接入企业通知工作流 — GitHub CHANGELOG
Claude Science 内置 reviewer agent：科研场景中专门检查引用与计算结果，可标记并修正错误，为代码审查提供了跨领域参考范式 — Anthropic
v2.1.198 安全模式 --safe-mode：启动时禁用 CLAUDE.md、plugins、skills、hooks、MCP servers，便于排查到底是哪个自定义层导致问题 — GitHub CHANGELOG

Claude Science 的“协调 agent + 专家 agent”模式：通用协调 agent 能 spawn 专家 agent 并调用 60+ 科学技能，适合借鉴到业务方案设计中的多 agent 分层架构 — Anthropic
v2.1.198 移除 /agents 向导：改为直接让 Claude 创建或管理子 Agent，或手动编辑 .claude/agents/，说明 Anthropic 希望子 Agent 从“向导式”走向“声明式/代码式” — GitHub CHANGELOG
Claude in Chrome 正式可用：v2.1.198 GA，浏览器端 Claude Code 进入稳定期，方案演示与协作门槛进一步降低 — GitHub CHANGELOG

Claude Code 内置 /dataviz 技能：v2.1.198 新增，专注图表与仪表盘设计，附带调色板验证器 — GitHub CHANGELOG
Claude Science 预置 60+ 科学技能：覆盖基因组学、单细胞、蛋白质组学、结构生物学、化学信息学等，可直接通过自然语言调用 — Anthropic
NVIDIA BioNeMo Agent Toolkit 技能集：作为 Claude Science 的原生连接器，提供 Evo 2、Boltz-2、OpenFold3 等生命科学模型能力 — NVIDIA Blog
今日其他新增 Skill 无显著重大发布：主要增量来自 Anthropic 官方与 NVIDIA 生态集成。

X 官方托管 MCP Server：AI 工具（Claude/Cursor/Grok Build 等）可直接访问 X API 进行搜索、读帖、查用户、分析趋势，只读模式不支持 Write API — TechCrunch
NVIDIA BioNeMo Agent Toolkit MCP：让任意 agent 接入蛋白质折叠、分子对接、生成化学、基因组分析等生命科学能力 — GitHub
Claude Science 连接科学数据库：通过 MCP/connector 接入 UniProt、PDB、Ensembl、Reactome、ChEMBL、GEO 等 60+ 数据源 — Anthropic

Claude Science + BioNeMo 端到端科研：从文献分析、实验设计、计算执行到可复现图表/论文生成， reviewer agent 全程校验引用与计算 — Anthropic
后台 Agent 自动开 PR 工作流：v2.1.198 让后台 Agent 变成“异步外包工程师”，适合夜间批量重构、文档生成等任务 — GitHub CHANGELOG
X MCP 只读舆情监控：结合 Claude Code / Cursor 可做实时 X 话题追踪、竞品动态、技术趋势扫描，但无法自动发帖避免滥用 — TechCrunch
Claude Science 可 fork 会话：不同方案可并行对比不丢失原线程，适合科研 A/B 实验设计 — Anthropic
Sonnet 5 长上下文 + agent 任务：1M token 让长任务保留完整过程状态（修改过哪些文件、跑过哪些命令、失败过哪些方案），减少上下文截断导致的 agent 迷失 — 腾讯新闻

本资讯由 AI 自动收集与整理。