AI HOT 日报 · 2026-06-18

模型发布/更新

MolmoMotion：语言引导的3D运动预测模型
Allen AI 基于 Molmo 2 骨干网络，输入视频帧、3D点标记及文字指令，预测未来数秒的3D轨迹。提供自回归和流匹配两个变体，同时发布116万视频的MolmoMotion-1M数据集。模型、数据集和基准测试均已开源。
来源
Grok 4.3 在 Amazon Bedrock 正式可用
xAI 的 Grok 4.3 在 Bedrock 上全面可用，达成最低幻觉率，支持100万token上下文。在多项基准排名第一，每美元智能度是其他前沿模型的2-10倍。定价：输入$1.25/M tokens，输出$2.50/M tokens。
来源

产品发布/更新

Vercel 发布开源 AI 智能体框架 Eve
文件系统优先设计：每个智能体对应一个磁盘目录。内置持久执行、沙箱计算、人机审批、多通道支持等六大生产级能力。Apache-2.0 许可。
来源
Omnigent 开源：AI 智能体团队元框架
Databricks AI 团队（Matei Zaharia 打造）的多智能体框架，可在单个会话中运行 Claude Code、Codex、Cursor、Pi 等多个智能体协同。
来源
Google 发布 99 美元 Gemini 智能音箱
首款专为 Gemini 打造的智能音箱，支持自然语言多步指令、说话中途纠正、连续对话。高级功能需订阅 Google Home Premium（$10/月）。
来源
Wolfram 语言和 Mathematica 15 版发布
近38年来首个大版本，内置 AI 助手、符号音乐系统、大规模时间序列处理。笔记本支持千兆字节级大小，DSolve 获 AI 方法辅助。
来源
阿里云发布 HappyOyster 1.0：一句话生成可实时交互的数字世界
原生多模态架构，支持多模态输入与音视频联合生成，可在生成过程中实时响应用户指令。提供"实时导演"与"世界探索"两种玩法。
来源
Claude Design 更新：跨项目保持品牌一致
支持从 GitHub、设计文件导入设计系统，管理员可锁定标准。新增桌面端侧边栏和独立网页端。发布首周用户超百万。支持导出 PDF、PPT，集成 Adobe、Canva、Gamma。
来源
Claude Design 与 Replit 联动
在 Claude 中设计，可直接发送到 Replit 变成可工作的应用。
来源
Strands Robots SDK：从 Hugging Face Hub 到物理机器人
AWS 开源（Apache 2.0），将 LeRobot 栈封装为 AgentTools。默认 MuJoCo 模拟，mode="real" 切换真实机器人。模拟与硬件代码完全一致。
来源

行业动态

Anthropic 与 DeepMind CEO 呼吁 G7 组建 AI 联盟排除中国
Dario Amodei 和 Demis Hassabis 在 G7 闭门会议上呼吁以前沿模型和芯片访问权限为手段，将中国排除在联盟之外。
来源
泄露文件显示 OpenAI 年营收 130 亿但亏损远超收入
2025年营收130.7亿（2024年37亿），研发成本191.8亿，运营亏损209.2亿。ChatGPT 周活超9亿，付费约5000万。已关闭 Sora 并削减非核心业务。
来源
OpenAI 今年一季度现金消耗达 37 亿美元
超过同期57亿美元收入的一半。正筹备上市，最早或于9月完成，估值最高可达1万亿美元。
来源
中国加紧筹建世界人工智能合作组织
2025年7月倡议成立，旨在弥合数字和智能鸿沟，初步考虑总部设在上海。
来源
谷歌发布 Agentic Resource Discovery (ARD) 开放规范
用于在 Web 上发布、发现和验证 AI 工具、技能与智能体。支持加密验证，确认发布者身份后再连接。
来源
Databricks 扩大对 Snowflake 的领先优势
Databricks ARR 达69亿美元（同比+80%），Snowflake 约53亿（+34%）。AI 产品年化收入17亿，占总ARR 25%。估值1340亿美元。
来源
Claude Opus 4.8 Build Day 黑客马拉松获奖项目
旧金山12小时黑客马拉松，310人参与。冠军 Tekton：输入历史建筑照片，Claude 自动重建3D模型；亚军 Sim Francisco：合成10000名市民精准预测选举；季军 Custom Universe：手机拍照转可拖放3D物体。
来源
Anthropic 在首尔开设办公室并宣布多项韩国合作
NAVER 全公司部署 Claude Code；LG CNS 推广至数千员工并计划覆盖整个 LG 集团；Samsung SDS 向三星电子员工部署 Claude。
来源

论文研究

NVIDIA GEAR 实验室发布 ENPIRE：8个 Codex 智能体自主控制机器人完成物理实验
首次实现物理世界自主研究，8个智能体控制8台机器人，支持通宵无人运行。完成扎带、整理细针、安装GPU等高精度任务。
来源
用 SGLang-JAX 在 TPU 上优化 Ling-2.6-1T
一个 Pallas 核将 MoE 数据移动隐藏在计算中，预填充延迟降低53%，解码吞吐量提升18.5%-35.3%。TPU v7x 性能达 H200 的1.29倍。
来源
LifeSciBench 发布
OpenAI 联合173位博士级生命科学家，涵盖750个真实研究任务，19020条评分标准。79%任务需多步推理，53%要求解读图表附件。
来源
Google 医学推理 AI 系统 AMIE：从诊断迈向长期疾病管理
发表在《自然》杂志，AMIE 整合共情对话和深度思考管理推理，在整体管理推理上匹配临床医生，计划精确性和指南一致性上显著更高。
来源
OpenAI 与 Molecule.one 合作：GPT-5.4 自主优化 Chan-Lam 偶联反应
GPT-5.4 独立识别高价值底物并建议温和氧化剂。经两轮实验，88%底物产率提升，平均产率从16.6%升至25.2%。
来源

技巧与观点

Matt Pocock 开源 skills v1：将技能描述 Token 成本降低 63%
将 prompt 从咒语拆解为纪律性流程，新增 /codebase-design、/domain-modeling 等技能。
来源
baoyu-design 本地动画视频导出功能更新
声明式动画引擎基于 f(t) 设计，逐帧截图 + ffmpeg 编码，95秒30fps动画需2850次截图。已开源，获1.2K star。
来源
Google 分享 A2UI 与 MCP Apps 三种集成架构模式
结合 A2UI 声明式框架和 MCP Apps iframe 自定义界面，实现"一次编写，原生渲染"的跨平台能力。
来源
预训练还不够"苦涩"
CMU 探讨 Sutton 苦涩教训的局限：现代预训练的训练目标仍由人类在训练循环外选定，控制环路非常粗糙，能否让这一环路更高效？
来源
博客现状，2026年中
Nathan Lambert 更新 Interconnects 博客规划：订阅者突破7万，付费约900人。已签署咨询协议，但银行账户余额接近零。
来源
特朗普向 Anthropic 提出不可能的要求
Gary Marcus 指出基于 next-token predictor 的 LLM 本质上不适合安全控制，问题非 Anthropic 独有，而是整个生成式 AI 面临的挑战。
来源