AI HOT 日报 · 2026-06-18
模型发布/更新
MolmoMotion:语言引导的3D运动预测模型
Allen AI 基于 Molmo 2 骨干网络,输入视频帧、3D点标记及文字指令,预测未来数秒的3D轨迹。提供自回归和流匹配两个变体,同时发布116万视频的MolmoMotion-1M数据集。模型、数据集和基准测试均已开源。
来源Grok 4.3 在 Amazon Bedrock 正式可用
xAI 的 Grok 4.3 在 Bedrock 上全面可用,达成最低幻觉率,支持100万token上下文。在多项基准排名第一,每美元智能度是其他前沿模型的2-10倍。定价:输入$1.25/M tokens,输出$2.50/M tokens。
来源
产品发布/更新
Vercel 发布开源 AI 智能体框架 Eve
文件系统优先设计:每个智能体对应一个磁盘目录。内置持久执行、沙箱计算、人机审批、多通道支持等六大生产级能力。Apache-2.0 许可。
来源Omnigent 开源:AI 智能体团队元框架
Databricks AI 团队(Matei Zaharia 打造)的多智能体框架,可在单个会话中运行 Claude Code、Codex、Cursor、Pi 等多个智能体协同。
来源Google 发布 99 美元 Gemini 智能音箱
首款专为 Gemini 打造的智能音箱,支持自然语言多步指令、说话中途纠正、连续对话。高级功能需订阅 Google Home Premium($10/月)。
来源Wolfram 语言和 Mathematica 15 版发布
近38年来首个大版本,内置 AI 助手、符号音乐系统、大规模时间序列处理。笔记本支持千兆字节级大小,DSolve 获 AI 方法辅助。
来源阿里云发布 HappyOyster 1.0:一句话生成可实时交互的数字世界
原生多模态架构,支持多模态输入与音视频联合生成,可在生成过程中实时响应用户指令。提供"实时导演"与"世界探索"两种玩法。
来源Claude Design 更新:跨项目保持品牌一致
支持从 GitHub、设计文件导入设计系统,管理员可锁定标准。新增桌面端侧边栏和独立网页端。发布首周用户超百万。支持导出 PDF、PPT,集成 Adobe、Canva、Gamma。
来源Claude Design 与 Replit 联动
在 Claude 中设计,可直接发送到 Replit 变成可工作的应用。
来源Strands Robots SDK:从 Hugging Face Hub 到物理机器人
AWS 开源(Apache 2.0),将 LeRobot 栈封装为 AgentTools。默认 MuJoCo 模拟,mode="real" 切换真实机器人。模拟与硬件代码完全一致。
来源
行业动态
Anthropic 与 DeepMind CEO 呼吁 G7 组建 AI 联盟排除中国
Dario Amodei 和 Demis Hassabis 在 G7 闭门会议上呼吁以前沿模型和芯片访问权限为手段,将中国排除在联盟之外。
来源泄露文件显示 OpenAI 年营收 130 亿但亏损远超收入
2025年营收130.7亿(2024年37亿),研发成本191.8亿,运营亏损209.2亿。ChatGPT 周活超9亿,付费约5000万。已关闭 Sora 并削减非核心业务。
来源OpenAI 今年一季度现金消耗达 37 亿美元
超过同期57亿美元收入的一半。正筹备上市,最早或于9月完成,估值最高可达1万亿美元。
来源中国加紧筹建世界人工智能合作组织
2025年7月倡议成立,旨在弥合数字和智能鸿沟,初步考虑总部设在上海。
来源谷歌发布 Agentic Resource Discovery (ARD) 开放规范
用于在 Web 上发布、发现和验证 AI 工具、技能与智能体。支持加密验证,确认发布者身份后再连接。
来源Databricks 扩大对 Snowflake 的领先优势
Databricks ARR 达69亿美元(同比+80%),Snowflake 约53亿(+34%)。AI 产品年化收入17亿,占总ARR 25%。估值1340亿美元。
来源Claude Opus 4.8 Build Day 黑客马拉松获奖项目
旧金山12小时黑客马拉松,310人参与。冠军 Tekton:输入历史建筑照片,Claude 自动重建3D模型;亚军 Sim Francisco:合成10000名市民精准预测选举;季军 Custom Universe:手机拍照转可拖放3D物体。
来源Anthropic 在首尔开设办公室并宣布多项韩国合作
NAVER 全公司部署 Claude Code;LG CNS 推广至数千员工并计划覆盖整个 LG 集团;Samsung SDS 向三星电子员工部署 Claude。
来源
论文研究
NVIDIA GEAR 实验室发布 ENPIRE:8个 Codex 智能体自主控制机器人完成物理实验
首次实现物理世界自主研究,8个智能体控制8台机器人,支持通宵无人运行。完成扎带、整理细针、安装GPU等高精度任务。
来源用 SGLang-JAX 在 TPU 上优化 Ling-2.6-1T
一个 Pallas 核将 MoE 数据移动隐藏在计算中,预填充延迟降低53%,解码吞吐量提升18.5%-35.3%。TPU v7x 性能达 H200 的1.29倍。
来源LifeSciBench 发布
OpenAI 联合173位博士级生命科学家,涵盖750个真实研究任务,19020条评分标准。79%任务需多步推理,53%要求解读图表附件。
来源Google 医学推理 AI 系统 AMIE:从诊断迈向长期疾病管理
发表在《自然》杂志,AMIE 整合共情对话和深度思考管理推理,在整体管理推理上匹配临床医生,计划精确性和指南一致性上显著更高。
来源OpenAI 与 Molecule.one 合作:GPT-5.4 自主优化 Chan-Lam 偶联反应
GPT-5.4 独立识别高价值底物并建议温和氧化剂。经两轮实验,88%底物产率提升,平均产率从16.6%升至25.2%。
来源
技巧与观点
Matt Pocock 开源 skills v1:将技能描述 Token 成本降低 63%
将 prompt 从咒语拆解为纪律性流程,新增 /codebase-design、/domain-modeling 等技能。
来源baoyu-design 本地动画视频导出功能更新
声明式动画引擎基于 f(t) 设计,逐帧截图 + ffmpeg 编码,95秒30fps动画需2850次截图。已开源,获1.2K star。
来源Google 分享 A2UI 与 MCP Apps 三种集成架构模式
结合 A2UI 声明式框架和 MCP Apps iframe 自定义界面,实现"一次编写,原生渲染"的跨平台能力。
来源预训练还不够"苦涩"
CMU 探讨 Sutton 苦涩教训的局限:现代预训练的训练目标仍由人类在训练循环外选定,控制环路非常粗糙,能否让这一环路更高效?
来源博客现状,2026年中
Nathan Lambert 更新 Interconnects 博客规划:订阅者突破7万,付费约900人。已签署咨询协议,但银行账户余额接近零。
来源特朗普向 Anthropic 提出不可能的要求
Gary Marcus 指出基于 next-token predictor 的 LLM 本质上不适合安全控制,问题非 Anthropic 独有,而是整个生成式 AI 面临的挑战。
来源
数据来自 AI HOT


