AI HOT 日报 · 2026年6月30日

gusi
gusi
·5 min read

AI HOT 日报 · 2026-06-30

模型发布/更新

  1. 美团 LongCat Owl Alpha:OpenRouter 最流行模型,1.6 万亿 MoE,国产 ASIC 训练
    — X:Emad Mostaque

    美团 LongCat 的 1.6 万亿参数 MoE 模型 Owl Alpha 成为 OpenRouter 上最流行模型,累计消耗 10 万亿 tokens,性能达 Gemini/Opus 4.6 级别。该模型使用 35 万亿 tokens 训练,完全在 5 万块国产 ASIC 上完成。上线后每日调用量全球 Top3,Hermes Agent 排名 #1,Claude Code 排名 #2,即将退役。
    🔗 https://x.com/EMostaque/status/2071701921241448574

产品发布/更新

  1. 从任何地点构建——Cursor for iOS 公测版发布
    — Cursor Blog

    Cursor 推出 iOS 原生公测版,支持云端智能体运行、语音输入、锁屏实时状态推送、双向云端-本地切换。移动端 Composer 2.5 享 75% 折扣至 7 月 5 日。
    🔗 https://cursor.com/blog/ios-mobile-app

  2. EverOS:开源 Markdown 优先智能体记忆运行时
    — MarkTechPost

    开源(Apache 2.0)智能体记忆运行时,以 Markdown 文件为记忆主体,支持 BM25 + 向量混合检索,LoCoMo 得分 93.05%,记忆随使用自我进化。
    🔗 https://www.marktechpost.com/2026/06/29/meet-everos-an-open-source-markdown-first-agent-memory-runtime-with-hybrid-bm25-vector-retrieval-and-self-evolving-skills

  3. 小红书 RedKnot 推理引擎:KV Cache 按注意力头拆解实现长文本加速
    — 公众号:小红书技术

    将 KV Cache 沿注意力头维度拆解,TTFT 最高加速 3.54×,单卡并发提升 7.8×,128K 上下文加速达 5.16×。
    🔗 https://mp.weixin.qq.com/s/qRrZvL0aZzYI82djFSrLug

  4. OpenClaw 发布原生 iOS 与 Android 应用
    — X:OpenClaw

    智能体装进口袋,支持频道、任务、回复随时随地处理。
    🔗 https://x.com/openclaw/status/2071688039114342592

  5. Herdr:驻留在终端中的 AI 智能体多路复用器
    — Hacker News 热门

    在单一终端界面内管理和切换多个 AI 智能体会话。
    🔗 https://github.com/ogulcancelik/herdr

  6. Claude Apps Gateway:为 Bedrock 和 Google Cloud 推出的企业控制平面
    — Claude Blog

    自托管容器,支持 SSO 登录(Google Workspace / Entra ID / Okta)、集中策略管理、消费上限和故障转移路由。
    🔗 https://claude.com/blog/introducing-the-claude-apps-gateway

  7. Claude 在 Microsoft Foundry 正式可用
    — Claude Blog

    Claude Opus 4.8 和 Haiku 4.5 登陆 Azure,运行于 NVIDIA GB300 GPU,支持提示缓存和扩展思考。
    🔗 https://claude.com/blog/claude-in-microsoft-foundry

  8. Claude Code v2.1.196 发布
    — Claude Code GitHub Releases

    新增组织默认模型、聊天会话命名、/code-review token 用量减少 25%、流式空闲看门狗默认开启等多项改进。
    🔗 https://github.com/anthropics/claude-code/releases/tag/v2.1.196

行业动态

  1. 国务院印发《教育发展「十五五」规划》,推进 AI 全学段教育
    — IT之家

    要求推进人工智能全学段教育,提升学生 AI 素养及提出/解决问题的能力,目标到 2030 年高质量教育体系基本建成。
    🔗 https://www.ithome.com/0/970/097.htm

  2. Rubin Ultra 取消,新版尺寸性能减半
    — X:SemiAnalysis

    原 4-die Rubin Ultra 因制造执行问题被取消,新版实际性能约为原版一半。
    🔗 https://x.com/SemiAnalysis_/status/2071700428249596290

  3. 美军用 AI 选目标却误炸伊朗学校,Claude 嵌入 Palantir 系统首日建议约 1000 目标
    — The Decoder

    美军首次大规模使用 AI(Claude 嵌入 Palantir Maven 系统)选择打击目标,但对一所学校的导弹袭击导致约 120 名儿童死亡。调查发现情报分析师标记信息未送达指挥官。
    🔗 https://the-decoder.com/the-us-military-used-ai-to-pick-thousands-of-targets-but-missed-a-note-saying-one-was-a-school

  4. 三星和 SK 海力士计划投资 5900 亿美元扩产芯片
    — The Decoder

    AI 数据中心需求推动内存价格飙升,2026 Q3 预计涨 40%-50%。两家公司控制全球近 80% 高带宽内存市场。
    🔗 https://the-decoder.com/samsung-and-sk-hynix-plan-590-billion-chip-investment-as-ai-demand-sends-memory-prices-soaring

  5. SK 集团会长崔泰源:到 2035 年建设 15GW AI 数据中心,总投资达 1000 万亿韩元
    — IT之家

    约 4.4 万亿元人民币,未来 10 年年均 100 万亿韩元以上国内投资,构建韩国智能市场。
    🔗 https://www.ithome.com/0/969/953.htm

论文研究

  1. Meta 发布 Brain2Qwerty v2:非侵入式实时句子解码
    — X:AI at Meta

    基于《Nature》发表的 v1 升级,从原始脑信号实时解码句子,有望帮助数百万因脑损伤无法沟通的人群。
    🔗 https://x.com/AIatMeta/status/2071566924803395741

  2. Claude Code 打开 GitHub 仓库即执行隐藏恶意代码,攻击者可获完全控制
    — The Decoder

    安全研究揭示新攻击向量:恶意 setup 脚本从 DNS 拉取命令,对扫描器和 AI 智能体不可见。Claude Code 自动运行后打开反向 shell。
    🔗 https://the-decoder.com/claude-code-runs-a-github-repos-hidden-malware-without-verification-giving-attackers-full-control

  3. OpenAI 报告:绘制欧洲 AI 劳动力机遇版图
    — OpenAI 官网

    分析 AI 对欧盟就业的影响,划定哪些职业面临自动化、增长或工作流程变化。
    🔗 https://openai.com/index/mapping-ai-jobs-transition-eu

  4. DiScoFormer:跨分布同时估计密度与分数的单一 Transformer 模型
    — Hugging Face Blog

    无需重新训练即可估计分布密度和分数,在 100 维空间中比最优 KDE 降低分数误差约 6.5 倍、密度误差超 37 倍。
    🔗 https://huggingface.co/blog/allenai/discoformer

技巧与观点

  1. Anthropic 工程师:提示词工程实战——调试为主,评估是唯一严谨方式
    — X:Berry Xia

    大部分时间在调试和维护已有生产提示词,用 XML 标签结构化清理,拆成生成-评估-修复三个简单提示词更稳定,反复强调:没有评估就是碰运气。
    🔗 https://x.com/berryxia/status/2071610700213191075

  2. Qwen 3.6 27B 是本地开发的理想选择
    — Hacker News 热门

    密集参数 27B,原生 256k 上下文。Macbook Max M5 上可达 30 tokens/s,RTX 5090 上可达 50 tokens/s,被称首个真正具备通用智能的本地模型。
    🔗 https://quesma.com/blog/qwen-36-is-awesome

  3. 分享两个 Vibe Coding 必备 Prompt:第一性原理与对抗式审查
    — 公众号:数字生命卡兹克

    第一性原理强制 AI 跳出类比推理从基本事实推导本质;对抗式审查让 AI 站在恶意用户角度审查代码。两个 Prompt 形成生成与验证闭环。
    🔗 https://mp.weixin.qq.com/s/umPqTD_-IubbhXIgiS47eQ

  4. Anthropic:当 AI 成本超过工程师薪酬
    — Tomer Tunguz 博客

    Anthropic 算力支出达每位工程师每年 51.5 万美元,是其完全薪资的 2.3 倍。三个 2029 年情景预测了这一差距的缩小路径。
    🔗 https://www.tomtunguz.com/ai-spend-breakeven-2029


📊 本日报共 22 条精选内容 | 数据来自 aihot.virxact.com