AI 日报 | 2026年6月5日:Nex-N2-Pro达GPT-5.5水平、ChatGPT推出Dreaming记忆系统、机器人流量首超人类

gusi
gusi
·5 min read

AI 日报 | 2026年6月5日

数据来自 aihot.virxact.com,最近 24 小时共 29 条精选。


今日亮点

  • Nex-N2-Pro 推理模型达 GPT-5.5 和 Claude Opus 4.7 水平
  • ChatGPT 推出 Dreaming 记忆系统,更好记住用户偏好
  • DeepSeek 连续四周登顶 OpenRouter Token 份额榜
  • Cloudflare 报告:机器人流量首次超过人类,占 57.5%
  • OpenAI 称 AI 递归自我改进(RSI)早期迹象初现

模型发布/更新

  1. Nex-N2-Pro:基于 Qwen3.5 的 397B MoE 推理模型 — 硅基流动
    性能达到 GPT-5.5 和 Claude Opus 4.7 级别,支持 262K 上下文与多模态,自动调节推理深度减少 30-50% 思考 token。硅基流动已提供 T+0 支持,前两周免费。
    https://x.com/SiliconFlowAI/status/2062549952266723493

  2. Nemotron 3.5 Content Safety:可定制多模态安全模型 — Hugging Face
    基于 Gemma 3 4B IT,128K 上下文,支持自然语言自定义安全策略,覆盖 12 种语言显式训练,可在 8GB+ VRAM GPU 上实时部署。
    https://huggingface.co/blog/nvidia/nemotron-3-5-content-safety

  3. Google Magenta RealTime 2(MRT2)实时音乐模型 — Google AI
    开放权重,可通过 MIDI 键盘、文本提示甚至手势演奏,MacBook 原生运行延迟低于 200ms。
    https://x.com/googleaidevs/status/2062603374789263646

  4. NVIDIA Nemotron 3 Ultra:为长时间运行智能体设计 — NVIDIA
    优化多轮对话中的上下文保持、工具调用和子智能体协作,显著提升速度并降低计算成本。
    https://developer.nvidia.com/blog/nvidia-nemotron-3-ultra-powers-faster-more-efficient-reasoning-for-long-running-agents

  5. Nemotron 3.5 ASR:600M 参数多语言流式语音识别 — Hugging Face
    单检查点覆盖 40 种语言,延迟-准确率权衡可从 80ms 到 1.12s 调节,无需重训练。
    https://huggingface.co/blog/nvidia/fine-tuning-nemotron-35-asr


产品发布/更新

  1. ChatGPT 推出 Dreaming 记忆系统 — OpenAI
    更有效地记住用户偏好,跨对话保持上下文新鲜感和相关性。
    https://openai.com/index/chatgpt-memory-dreaming

  2. NotebookLM 来源归属功能上线 — NotebookLM
    可看到每个创作物背后的确切公式(提示词 + 来源),点击"迭代"即可定制。
    https://x.com/NotebookLM/status/2062653124326863077

  3. Gemini macOS 双击 Command 附加活动窗口 — Gemini
    同时按下两个 Command 键即可将当前窗口附加到聊天,无需截图。
    https://x.com/GeminiApp/status/2062652523945836770

  4. Anthropic 开源 AI 驱动漏洞发现框架 — GitHub
    借助 AI 技术进行漏洞发现,帮助识别软件安全缺陷。
    https://github.com/anthropics/defending-code-reference-harness

  5. OpenAI API 新增内容审核评分 — OpenAI Developers
    在 Responses API 和 Completions API 中与生成同时返回审核信号。
    https://x.com/OpenAIDevs/status/2062619558440267801

  6. Codex 推出 iOS 应用构建插件 — OpenAI Developers
    可在应用内查看和测试 iOS 应用,打开 SwiftUI 预览并热重载编辑。
    https://x.com/OpenAIDevs/status/2062599291479478275

  7. Replit Agent 联手 Shopify 快速建店 — Replit
    告诉 Agent 你想卖什么,它会构建店铺、创建 Shopify 商店、添加商品。
    https://x.com/Replit/status/2062594881625940379

  8. OpenJarvis:本地优先的设备端个人 AI 智能体框架 — MarkTechPost
    Stanford 发布,完全在设备端运行推理、记忆与学习,与最佳云端模型差距 3.2 分内,API 成本降低约 800 倍。
    https://www.marktechpost.com/2026/06/03/meet-openjarvis-a-local-first-framework-for-on-device-personal-ai-agents-with-tools-memory-and-learning


行业动态

  1. DeepSeek 连续四周登顶 Token 份额榜 — OpenRouter
    https://x.com/OpenRouter/status/2062538625225548118

  2. 台积电难以跟上 AI 需求 — The Verge
    全球最大芯片制造商表示通过美国本土生产满足客户需求可能需要"非常长的时间"。
    https://www.theverge.com/tech/943066/tsmc-ai-demand-struggles

  3. 微软 AI 负责人:Anthropic 模型太贵,正自研替代 — Bloomberg
    https://www.bloomberg.com/news/newsletters/2026-06-04/microsoft-says-anthropic-models-are-too-expensive

  4. Cloudflare Radar:机器人流量首次超过人类占 57.5% — X:小互
    全球 HTML 请求中 57.5% 来自机器人,JSON(API 机器通信)占 33.1% 居首,互联网主体已从人类浏览转向机器间通信。
    https://x.com/xiaohu/status/2062367357868355622

  5. Nemotron Parakeet ASR 印尼语准确率达 97.7% — NVIDIA
    微调后每小时成本降低高达 90%。
    https://x.com/nvidia/status/2062647600424128773

  6. 联合国报告:2030年 AI 数据中心水电消耗将翻倍 — IT之家
    去年全球数据中心耗电 448 太瓦时,预计 2030 年翻倍至 945 太瓦时,耗水增至 9.3 万亿升。
    https://www.ithome.com/0/959/607.htm


论文研究

  1. Google Research 被动心率监测系统 PHRM — Google Research Blog
    利用智能手机前置摄像头估算心率,MAPE 低于 10%,发布了迄今最大规模公开数据集。
    https://research.google/blog/towards-passive-heart-health-monitoring-via-smartphone-camera

  2. EVA-Bench Data 2.0:覆盖三大领域 121 工具 213 场景 — Hugging Face
    扩展至航空 CSM、企业 ITSM 和医疗 HRSD,场景数增长约 4 倍,已开源。
    https://huggingface.co/blog/ServiceNow-AI/eva-bench-data

  3. Nemotron 预训练任务种子合成问答生成 — Hugging Face
    在 100B token 续训练中 GPQA 提升 11.1 分,MMLU-Pro 提升 1.8 分。
    https://huggingface.co/blog/nvidia/task-seeded-sdg

  4. NVIDIA PPISP:补偿光度变化提升 3D 重建 — NVIDIA AI
    使 3D 重建在光照和相机设置不完全一致时更加鲁棒。
    https://x.com/NVIDIAAI/status/2062358080222876041


技巧与观点

  1. OpenAI 称 AI 递归自我改进迹象初现 — X:Kim
    OpenAI 表示看到了 RSI 早期迹象:AI 开发本身正被 AI 加速,社会需要找到塑造 AI 发展轨迹的方法。
    https://x.com/kimmonismus/status/2062517474277675102

  2. Higgs Audio v3 TTS:100 种语言端到端语音服务 — LMSYS
    基于 Qwen3-4B 骨干约 4B 参数,支持 20+ 种情感实时控制和流式合成。
    https://www.lmsys.org/blog/2026-06-04-higgs-audio-v3-tts

  3. OpenRouter 11 款 LLM 大逃杀:Claude vs. Grok 领衔 — OpenRouter
    传统静态 benchmark 排名无法反映实时决策中的真实表现,Claude 和 Grok 系列在决策速度与成功率上表现突出。
    https://openrouter.ai/announcements/royale-last-agent-standing

  4. 共存与协同智能的终结 — Ethan Mollick
    https://www.oneusefulthing.org/p/co-existence-and-the-end-of-co-intelligence

  5. AGI 后什么仍然稀缺? — Dwarkesh Patel
    经济学家指出即使技术大幅进步,人类独特技能(如芭蕾舞演员)仍不可替代。
    https://www.dwarkesh.com/p/alex-imas-phil-trammell

  6. Nemotron 3.5 ASR 微调指南 — Hugging Face
    600M 参数模型支持适配特定语言、领域或口音。
    https://huggingface.co/blog/nvidia/fine-tuning-nemotron-35-asr


数据来自 aihot.virxact.com · 最近 24 小时精选

Dejar un comentario

Comparte tus pensamientos. Los campos marcados con * son obligatorios.

Tu correo electrónico no se mostrará públicamente

Comentarios

0