AI HOT 日报 · 2026年6月3日:微软MAI-Thinking-1发布、NVIDIA NemoClaw亮相、Anthropic提交IPO申请

gusi
gusi
·5 min read

AI HOT 日报 · 2026年6月3日

数据来自 aihot.virxact.com · 时间窗:2026-06-02 08:00 ~ 2026-06-03 08:00 · 共42条精选


模型发布/更新

1. 微软首款高级推理AI模型MAI-Thinking-1发布 — The Verge

微软在Build 2026上发布了其首款高级推理AI模型MAI-Thinking-1。该模型被定位为"中等规模",能在"关键"软件工程基准测试中达到领先模型的水平。微软称其完全从头使用干净数据进行训练,未涉及从第三方模型进行知识蒸馏。这标志着微软在自研AI模型上迈出重要一步。

https://www.theverge.com/tech/941664/microsoft-ai-model-reasoning-mai-thinking-1-build-2026

2. Holo3.1:快速本地计算机使用智能体 — Hugging Face

Holo3.1是基于Qwen模型家族的计算机使用智能体系列,提供0.8B、4B、9B和35B-A3B四种尺寸。新模型首次发布量化检查点(FP8、Q4 GGUF、NVFP4),在AndroidWorld基准测试中35B-A3B模型得分从67%提升至79.3%。在DGX Spark上,NVFP4量化实现1.74倍token吞吐量提升。

https://huggingface.co/blog/Hcompany/holo31

3. 阶跃星辰Step 3.7 Flash发布 — 阶跃星辰

阶跃星辰发布推理优化型模型Step 3.7 Flash,采用196B MoE架构。其多矩阵分解注意力机制使KV-cache成本仅为DeepSeek模型的约22%;通过注意力与FFN解耦技术实现硬件优化的高效服务。已通过Fireworks AI提供,采用Apache 2.0许可。

https://x.com/StepFun_ai/status/2061655529731342402


产品发布/更新

4. NVIDIA推出NemoClaw平台 — NVIDIA Blog

在COMPUTEX上,NVIDIA发布了NemoClaw平台,这是一个用于构建专业、长时间运行AI智能体的开放蓝图。该平台提供安全运行时、前沿模型支持以及多种编排框架集成选项。Cadence、达索系统、西门子、Synopsys等十多家工业软件厂商正基于NemoClaw构建用于CAE和EDA工作流的自主AI工程师。

https://blogs.nvidia.com/blog/industrial-software-leaders-secure-autonomous-ai-engineers-nemoclaw

5. Claude Code新增动态工作流功能 — Claude Blog

Claude Code新增动态工作流功能,允许模型在运行时即兴创建和协调多智能体框架来处理复杂任务。该功能通过执行特定的JavaScript文件来生成和协调拥有独立上下文窗口的子代理,适用于研究、安全分析、代码审查等场景。

https://claude.com/blog/a-harness-for-every-task-dynamic-workflows-in-claude-code

6. Google DeepMind开源科学智能体工具包 — Google AI for Developers

Google DeepMind开源了Science Skills专用工具包,用于构建科学发现的自主智能体。该工具包以科学基础和更高的token效率加速智能体工作流,现已在GitHub上发布。

https://github.com/google-deepmind/science-skills

7. NVIDIA DGX Station开始交付 — NVIDIA

搭载GB300的NVIDIA DGX Station系统正开始送达开发者和研究人员。企业团队可以本地部署数据中心级性能,系统正从华硕、戴尔、技嘉、惠普、微星和超微等合作伙伴处发货。

https://blogs.nvidia.com/blog/financial-institutions-transaction-foundation-models

8. Runway API推出Aleph 2.0 — Runway

Aleph 2.0现已通过Runway API提供,支持在多镜头序列中编辑最长30秒、1080p分辨率的视频,仅修改用户想要的部分。

https://x.com/runwayml/status/2061895998545244342

9. OpenRouter上线微软三款新模型 — OpenRouter

三款新的微软模型已在OpenRouter上线:MAI-Image-2.5、MAI-Transcribe-1.5和MAI-Voice-2。

https://x.com/OpenRouter/status/2061894672847671724

10. Replit与微软合作发布Fabric集成 — Replit

组织现在可以在Replit中构建内部工具、工作流或数据仪表板,并直接发布到Microsoft Fabric,内置安全、身份验证和治理功能。

https://x.com/Replit/status/2061892255028486435

11. OpenAI Codex推出团队专属插件 — OpenAI Developers

Codex中的角色专属插件围绕团队实际工作构建,包括数据分析、创意制作和产品设计插件,为Codex提供创建报告、创意方向和原型的工具与上下文。

https://x.com/OpenAIDevs/status/2061888366791246071

12. Claude Platform新增CLI工具 — Claude Devs

为Claude Platform添加了CLI,使每个API端点都可以从终端运行。可调用Messages API,启动Claude托管智能体,并将结果直接管道传输到shell。

https://x.com/ClaudeDevs/status/2061877343078244459

13. NVIDIA发布自进化Hermes智能体 — NVIDIA AI

自进化Hermes智能体:随使用而改进的企业AI,来自Nemotron Labs。

https://x.com/NVIDIAAI/status/2061870499232190967

14. OpenClaw与微软合作进入企业生态 — OpenClaw

OpenClaw宣布与微软合作,将OpenClaw带入微软和Windows生态系统,Claws现在可以在企业环境中安全运行。

https://x.com/openclaw/status/2061869633624580452

15. GitHub Copilot应用:智能体原生桌面体验 — GitHub Blog

在微软Build 2026大会上,GitHub发布新的工具和更新,将Copilot应用定位为"智能体原生的桌面体验",核心目标是让AI智能体能够以用户已经习惯的方式进行工作。

https://github.blog/news-insights/product-news/github-copilot-app-the-agent-native-desktop-experience

16. Google DeepMind发布Gemini多智能体科研系统 — Google DeepMind

Co-Scientist:基于Gemini的多智能体系统,能够为复杂科学问题生成、辩论和演进新颖的假设。

https://x.com/GoogleDeepMind/status/2061857539977842793

17. OpenAI Codex发布Python SDK — Vista

Codex出Python SDK了。安装指令:pip install openai-codex。整合到自己的代码中,相当于直接内置了顶级编程和生图Agent,可以复用Codex登录态。

https://x.com/vista8/status/2061846741885018296

18. OpenAI Codex Sites功能发布 — OpenAI

通过Sites,Codex可以将工作、想法和计划转化为交互式网站或应用,团队可以通过URL进行探索、使用和分享。该功能将首先向Business和Enterprise计划推出。

https://x.com/OpenAI/status/2061845949170045346

19. 商汤开源SenseNova-Skills AI办公技能套件 — 商汤

商汤开源了AI办公技能套件SenseNova-Skills,提供四大核心功能:图像信息图表生成、数据分析、PPT创建以及深度研究。该技能套件现已完全开源。

https://x.com/SenseTime_AI/status/2061822148076093625

20. MiniCPM-V 4.6支持vLLM v0.22.0 — 面壁智能

MiniCPM-V 4.6现已完全支持vLLM v0.22.0,无需自定义分支,无需额外编译,只需拉取预构建包即可运行。

https://x.com/OpenBMB/status/2061810723169415205

21. 阿里云发布AgentScope Java 1.1 — 阿里云

AgentScope Java 1.1支持构建可自我进化的智能体,新增Claw(具备Shell访问权限的本地"MinQwenPaw")和Builder多租户零代码企业平台。

https://x.com/alibaba_cloud/status/2061745401393291554

22. NVIDIA JetPack 7.2发布 — NVIDIA Technical Blog

NVIDIA JetPack 7.2支持一键部署开源NVIDIA NemoClaw堆栈,引入NVIDIA agent skills for Jetson,优化内存效率,加速AI代理从数字世界向物理环境的边缘部署。

https://developer.nvidia.com/blog/deploy-agentic-ready-ai-at-the-edge-with-memory-efficiency-in-nvidia-jetpack-7-2


行业动态

23. Anthropic支持美国AI行政令实施 — Anthropic

这项行政令是加强美国AI领导地位的重要一步。Anthropic期待与白宫合作,支持其实施。

https://x.com/AnthropicAI/status/2061924580222968183

24. Alphabet拟融资800亿美元,Anthropic提交IPO申请 — Bloomberg

Alphabet宣布拟通过股权融资800亿美元用于扩展AI基础设施。Anthropic已秘密提交IPO申请,在上市竞赛中领先于竞争对手OpenAI。SpaceX正与华尔街机构协商其IPO的承销费用。

https://www.bloomberg.com/news/videos/2026-06-02/bloomberg-tech-6-2-2026-video

25. Nathan Lambert离开Ai2 — Nathan Lambert

Ai2研究员Nathan Lambert宣布离职。他在Ai2工作超过2.5年,主导或参与了OLMO和Tulu等开源模型项目,表示将暂时休息,未来仍会继续深耕开源模型与开放科学领域。

https://x.com/natolambert/status/2061813361848029631

26. Anthropic扩展Project Glasswing计划 — Anthropic

Anthropic正将其Project Glasswing计划扩展至约150个新组织,覆盖电力、水务、医疗、通信和硬件等关键基础设施行业。项目旨在利用Claude Mythos Preview等前沿模型扫描漏洞并协助修复。

https://www.anthropic.com/news/expanding-project-glasswing

27. SK海力士计划未来五年内晶圆产能翻倍 — IT之家

SK海力士会长崔泰源宣布,计划在未来五年内将整体晶圆产能提高一倍,以应对AI普及带来的持续存储供应短缺。他预测AI数据中心和AI PC的普及将持续拉动存储需求,供需紧张局面可能延续至2030年。

https://www.ithome.com/0/958/810.htm

28. OpenAI呼吁推进青年AI安全与机遇 — OpenAI

OpenAI呼吁通过设立专门的AI安全研究所,在全球范围内采取行动,以保障青少年在使用AI时的安全,并创造更多发展机遇。

https://openai.com/index/advancing-youth-safety-and-opportunity-through-global-leadership


论文研究

29. 微软Aurora天气预报速度超传统超算数千倍 — Microsoft Research

天气预报速度比传统超级计算机快数千倍。

https://x.com/MSFTResearch/status/2061927189977727450

30. Anthropic可解释性研究新进展 — Anthropic Transformer Circuits

Anthropic可解释性团队介绍了Circuits研究的新进展,提出一种区分激活模式相似但因果效应不同的模型特征的新方法,通过分析特征的下游连接来预测其实际影响。

https://transformer-circuits.pub/2026/may-update/index.html

31. 金融机构正汇聚在交易基础模型上 — NVIDIA AI Blog

金融机构正从为每个业务线构建独立AI模型,转向采用基于Transformer的交易基础模型。NVIDIA报告显示,65%的金融机构已使用AI,近90%正在部署或评估。Revolut与NVIDIA合作构建了PRAGMA模型系列,在240亿事件上训练。

https://blogs.nvidia.com/blog/financial-institutions-transaction-foundation-models


技巧与观点

32. Claude Code自我检查与反馈闭环技巧 — Claude Devs

如何让Claude Code在交回工作前检查自己的成果?编码你的手动检查,让Claude自己关闭反馈循环。

https://x.com/ClaudeDevs/status/2061900434722496604

33. Claude Code团队实践:智能体编程如何重塑工程组织 — Claude Blog

Claude Code工程团队分享了将智能体编程设为默认工作方式后带来的流程与结构变革。核心变化包括:规划转向即时(JIT)模式,上下文收集变为"先问Claude",代码审查中Claude处理风格与测试,人工专注于法律、安全等专业判断。

https://claude.com/blog/running-an-ai-native-engineering-org

34. Gary Marcus:为什么事情终将崩塌 — Gary Marcus

知名人工智能批评者Gary Marcus探讨了人工智能发展面临的根本性挑战,指出数学理论的局限性与人类心理的复杂性是导致AI系统最终可能出现问题的根源。

https://garymarcus.substack.com/p/why-things-will-eventually-fall-apart

35. Gemini Spark:最令人印象深刻也最可怕的AI体验 — The Verge

Google DeepMind的AI模型Gemini Spark提供了一次极为深刻但同时令人感到不安的用户体验,其强大能力令人印象深刻,但带来的影响和潜力也引发了深刻的恐惧感。

https://www.theverge.com/ai-artificial-intelligence/941388/gemini-spark-ai-agent-trip-planning

36. 开放模型的繁荣生态 — Tomer Tunguz

根据OpenRouter平台数据,自2025年以来开放权重模型产生了69.1%的token使用量,闭源模型为30.9%。开放模型市场内部竞争激烈,领导地位频繁更迭。

https://www.tomtunguz.com/the-thriving-ecosystem-of-open-models

37. 为了不花120刀,把电脑清理软件做成了开源skill — 卡兹克

作者使用Codex对MacBook进行了只读存储分析,制作并开源了一个跨平台AI清理skill。该skill会扫描文件并生成可交互的HTML报告,通过三色分级直观展示。实测清理后释放了近120G空间。

https://x.com/Khazix0918/status/2061669881725309048


本日报由 AI HOT 自动生成,数据来自 aihot.virxact.com

Leave a Comment

Share your thoughts about this page. All fields marked with * are required.

We'll never share your email.

Comments

0