AI 日报 | 2026年6月5日
数据来自 aihot.virxact.com,最近 24 小时共 29 条精选。
今日亮点
- Nex-N2-Pro 推理模型达 GPT-5.5 和 Claude Opus 4.7 水平
- ChatGPT 推出 Dreaming 记忆系统,更好记住用户偏好
- DeepSeek 连续四周登顶 OpenRouter Token 份额榜
- Cloudflare 报告:机器人流量首次超过人类,占 57.5%
- OpenAI 称 AI 递归自我改进(RSI)早期迹象初现
模型发布/更新
Nex-N2-Pro:基于 Qwen3.5 的 397B MoE 推理模型 — 硅基流动
性能达到 GPT-5.5 和 Claude Opus 4.7 级别,支持 262K 上下文与多模态,自动调节推理深度减少 30-50% 思考 token。硅基流动已提供 T+0 支持,前两周免费。
https://x.com/SiliconFlowAI/status/2062549952266723493Nemotron 3.5 Content Safety:可定制多模态安全模型 — Hugging Face
基于 Gemma 3 4B IT,128K 上下文,支持自然语言自定义安全策略,覆盖 12 种语言显式训练,可在 8GB+ VRAM GPU 上实时部署。
https://huggingface.co/blog/nvidia/nemotron-3-5-content-safetyGoogle Magenta RealTime 2(MRT2)实时音乐模型 — Google AI
开放权重,可通过 MIDI 键盘、文本提示甚至手势演奏,MacBook 原生运行延迟低于 200ms。
https://x.com/googleaidevs/status/2062603374789263646NVIDIA Nemotron 3 Ultra:为长时间运行智能体设计 — NVIDIA
优化多轮对话中的上下文保持、工具调用和子智能体协作,显著提升速度并降低计算成本。
https://developer.nvidia.com/blog/nvidia-nemotron-3-ultra-powers-faster-more-efficient-reasoning-for-long-running-agentsNemotron 3.5 ASR:600M 参数多语言流式语音识别 — Hugging Face
单检查点覆盖 40 种语言,延迟-准确率权衡可从 80ms 到 1.12s 调节,无需重训练。
https://huggingface.co/blog/nvidia/fine-tuning-nemotron-35-asr
产品发布/更新
ChatGPT 推出 Dreaming 记忆系统 — OpenAI
更有效地记住用户偏好,跨对话保持上下文新鲜感和相关性。
https://openai.com/index/chatgpt-memory-dreamingNotebookLM 来源归属功能上线 — NotebookLM
可看到每个创作物背后的确切公式(提示词 + 来源),点击"迭代"即可定制。
https://x.com/NotebookLM/status/2062653124326863077Gemini macOS 双击 Command 附加活动窗口 — Gemini
同时按下两个 Command 键即可将当前窗口附加到聊天,无需截图。
https://x.com/GeminiApp/status/2062652523945836770Anthropic 开源 AI 驱动漏洞发现框架 — GitHub
借助 AI 技术进行漏洞发现,帮助识别软件安全缺陷。
https://github.com/anthropics/defending-code-reference-harnessOpenAI API 新增内容审核评分 — OpenAI Developers
在 Responses API 和 Completions API 中与生成同时返回审核信号。
https://x.com/OpenAIDevs/status/2062619558440267801Codex 推出 iOS 应用构建插件 — OpenAI Developers
可在应用内查看和测试 iOS 应用,打开 SwiftUI 预览并热重载编辑。
https://x.com/OpenAIDevs/status/2062599291479478275Replit Agent 联手 Shopify 快速建店 — Replit
告诉 Agent 你想卖什么,它会构建店铺、创建 Shopify 商店、添加商品。
https://x.com/Replit/status/2062594881625940379OpenJarvis:本地优先的设备端个人 AI 智能体框架 — MarkTechPost
Stanford 发布,完全在设备端运行推理、记忆与学习,与最佳云端模型差距 3.2 分内,API 成本降低约 800 倍。
https://www.marktechpost.com/2026/06/03/meet-openjarvis-a-local-first-framework-for-on-device-personal-ai-agents-with-tools-memory-and-learning
行业动态
DeepSeek 连续四周登顶 Token 份额榜 — OpenRouter
https://x.com/OpenRouter/status/2062538625225548118台积电难以跟上 AI 需求 — The Verge
全球最大芯片制造商表示通过美国本土生产满足客户需求可能需要"非常长的时间"。
https://www.theverge.com/tech/943066/tsmc-ai-demand-struggles微软 AI 负责人:Anthropic 模型太贵,正自研替代 — Bloomberg
https://www.bloomberg.com/news/newsletters/2026-06-04/microsoft-says-anthropic-models-are-too-expensiveCloudflare Radar:机器人流量首次超过人类占 57.5% — X:小互
全球 HTML 请求中 57.5% 来自机器人,JSON(API 机器通信)占 33.1% 居首,互联网主体已从人类浏览转向机器间通信。
https://x.com/xiaohu/status/2062367357868355622Nemotron Parakeet ASR 印尼语准确率达 97.7% — NVIDIA
微调后每小时成本降低高达 90%。
https://x.com/nvidia/status/2062647600424128773联合国报告:2030年 AI 数据中心水电消耗将翻倍 — IT之家
去年全球数据中心耗电 448 太瓦时,预计 2030 年翻倍至 945 太瓦时,耗水增至 9.3 万亿升。
https://www.ithome.com/0/959/607.htm
论文研究
Google Research 被动心率监测系统 PHRM — Google Research Blog
利用智能手机前置摄像头估算心率,MAPE 低于 10%,发布了迄今最大规模公开数据集。
https://research.google/blog/towards-passive-heart-health-monitoring-via-smartphone-cameraEVA-Bench Data 2.0:覆盖三大领域 121 工具 213 场景 — Hugging Face
扩展至航空 CSM、企业 ITSM 和医疗 HRSD,场景数增长约 4 倍,已开源。
https://huggingface.co/blog/ServiceNow-AI/eva-bench-dataNemotron 预训练任务种子合成问答生成 — Hugging Face
在 100B token 续训练中 GPQA 提升 11.1 分,MMLU-Pro 提升 1.8 分。
https://huggingface.co/blog/nvidia/task-seeded-sdgNVIDIA PPISP:补偿光度变化提升 3D 重建 — NVIDIA AI
使 3D 重建在光照和相机设置不完全一致时更加鲁棒。
https://x.com/NVIDIAAI/status/2062358080222876041
技巧与观点
OpenAI 称 AI 递归自我改进迹象初现 — X:Kim
OpenAI 表示看到了 RSI 早期迹象:AI 开发本身正被 AI 加速,社会需要找到塑造 AI 发展轨迹的方法。
https://x.com/kimmonismus/status/2062517474277675102Higgs Audio v3 TTS:100 种语言端到端语音服务 — LMSYS
基于 Qwen3-4B 骨干约 4B 参数,支持 20+ 种情感实时控制和流式合成。
https://www.lmsys.org/blog/2026-06-04-higgs-audio-v3-ttsOpenRouter 11 款 LLM 大逃杀:Claude vs. Grok 领衔 — OpenRouter
传统静态 benchmark 排名无法反映实时决策中的真实表现,Claude 和 Grok 系列在决策速度与成功率上表现突出。
https://openrouter.ai/announcements/royale-last-agent-standing共存与协同智能的终结 — Ethan Mollick
https://www.oneusefulthing.org/p/co-existence-and-the-end-of-co-intelligenceAGI 后什么仍然稀缺? — Dwarkesh Patel
经济学家指出即使技术大幅进步,人类独特技能(如芭蕾舞演员)仍不可替代。
https://www.dwarkesh.com/p/alex-imas-phil-trammellNemotron 3.5 ASR 微调指南 — Hugging Face
600M 参数模型支持适配特定语言、领域或口音。
https://huggingface.co/blog/nvidia/fine-tuning-nemotron-35-asr
数据来自 aihot.virxact.com · 最近 24 小时精选


