AI HOT 日报 · 2026-06-25

gusi
gusi
·5 min read

AI HOT 日报 · 2026-06-25

模型发布/更新

  1. OpenAI ChatGPT 语音最大规模升级:双向AI语音模型 Bidi 1 已上线测试
    部分用户发现 ChatGPT 上线了双向 AI 语音模型 Bidi 1,支持边说话边监听、中途打断并发出新指令。OpenAI 尚未官宣,预计本周更大范围测试。
    https://www.ithome.com/0/967/852.htm

  2. Qwen-AgentWorld 开源:让 Agent 学会"先预测,再行动"
    通义千问推出首个原生语言世界模型 Qwen-AgentWorld,覆盖 MCP、Search、Terminal 等七大领域,基于超 1000 万条真实交互轨迹训练,在 AgentWorldBench 上超越 GPT-5.4 和 Claude Opus 4.8。
    https://mp.weixin.qq.com/s/NV9WGpGsfFz35jww5agM9g

  3. Gemini 3.5 Flash 内置计算机使用能力
    Google 将 Computer Use 作为内置工具集成至 Gemini 3.5 Flash,开发者可构建跨浏览器、移动端和桌面的智能体,新增企业级安全保护:用户确认敏感操作、检测到提示注入自动停止。
    https://blog.google/innovation-and-ai/models-and-research/gemini-models/introducing-computer-use-gemini-3-5-flash

  4. GPT-5.5 Instant 新版本,对话更有趣
    OpenAI 更新 GPT-5.5 Instant,能更好理解问题背后的意图,更可靠地处理复杂约束,购物和本地推荐更实用。今天向付费用户推送,明天向免费用户推送。
    https://x.com/OpenAI/status/2069843083701915755

产品发布/更新

  1. 豆包正式推出专业版
    基于豆包2.1系列大模型,面向复杂办公场景,支持操作本地电脑、浏览器、调用 Skills 技能、定时任务,内置 Office 套件。标准套餐 68 元/月,大学生认证后 38 元/月。
    https://mp.weixin.qq.com/s/Sb-NMXTrWFQES1EDO_Gr2g

  2. Figma Config 2026:画布扩展至代码、动画、3D
    设计画布新增 Code Layers、Motion 动画、深度层、Shader 及 Generative Plugins。AI 功能依赖 Anthropic、OpenAI 等外部模型,推理成本挤压利润率。
    https://the-decoder.com/figma-bets-on-human-judgment-at-config-2026-while-the-ai-powering-its-canvas-belongs-to-someone-else

  3. 火山引擎推出 Agent Ready 基础设施
    AgentKit 升级提供 Identity、Runtime、Sandbox、Evaluation 模块,Runtime 支持长程任务和分钟级 12 万沙箱并发。海底捞门店经营 Agent 人工跟进时长缩减 70%。
    https://mp.weixin.qq.com/s/83mrPAPgQRKhxLkoSvRgBQ

  4. Notion 使用 Cursor SDK 嵌入编码智能体
    用户可在文档中 @Cursor、在讨论串中提及或向数据库指派任务,Cursor 端到端完成规划、构建、测试并自动创建 PR。基于 Provider 无关的智能体框架。
    https://cursor.com/blog/notion

  5. Perplexity 推出 Computer for Counsel
    连接律师日常使用的研究数据库、文档工具和案件管理系统,可提取可引用来源。Pro 和 Max 订阅用户可用。
    https://x.com/perplexity_ai/status/2069866668671766804

  6. Mistral AI Connectors 多项安全与可控新能力
    新增 Enriched admin controls、API keys with connector scopes、Multi-account connectors、Connectors Debugger 等能力,支持按工作空间设置连接器访问权限。
    https://mistral.ai/news/more-control-over-connectors

  7. FFASR 排行榜发布:真实远场条件下 ASR 评测
    Treble Technologies 与 Hugging Face 联合推出首个开源社区驱动的远场声学条件 ASR 评测基准,涵盖 14 种房间和三个信噪比级别。
    https://huggingface.co/blog/ffasr-leaderboard

  8. OpenAI 与 Broadcom 发布定制推理芯片 Jalapeño
    专为 LLM 推理优化,旨在提升 AI 系统的性能、效率与规模。
    https://openai.com/index/openai-broadcom-jalapeno-inference-chip

行业动态

  1. NSA 因与 Anthropic 纠纷失去对 Mythos 系统访问权限
    美国国家安全局因与 Anthropic 的纠纷,失去了对 Mythos 系统的访问权限。
    https://www.nytimes.com/2026/06/23/us/politics/nsa-lost-access-anthropic-tool.html

论文研究

  1. DFlash:块扩散草稿模型实现最高 15 倍吞吐量提升
    UC San Diego 团队提出的投机解码方案,一次前向推理生成整块 token,在 NVIDIA Blackwell 上 gpt-oss-120b 吞吐量提升最高 15 倍。
    https://www.marktechpost.com/2026/06/24/dflash-speculative-decoding-drafts-whole-token-blocks-in-parallel-for-up-to-15x-higher-throughput-on-nvidia-blackwell

  2. 思考即回忆:推理如何解锁 LLM 中的参数化知识
    Google Research 发现 chain-of-thought 能帮助 LLM 回忆简单事实,即使无需复杂推导。推理 token 充当计算缓冲,相关事实起启动效应。
    https://research.google/blog/thinking-to-recall-how-reasoning-unlocks-parametric-knowledge-in-llms

技巧与观点

  1. 里德·霍夫曼称 SpaceX 不是 AI 公司,xAI 是彻底灾难
    LinkedIn 联合创始人公开批评 SpaceX 收购 Cursor 属于花钱买相关性,xAI 所有 11 位联合创始人已离职,Grok 模型落后于 Anthropic 和 OpenAI。
    https://fortune.com/2026/06/24/reid-hoffman-spacex-musk-openai-anthropic-gen-z-mistake

  2. 字节跳动洪定坤:AI Coding 实践与探索
    字节 AI 代码贡献率增长 6 倍,但人均需求吞吐率仅提升 60%。900 次实验显示主流模型代码正确率超 80%,可交付性仅 40-60 分;结合 Harness 基建后提升至 80 分。
    https://mp.weixin.qq.com/s/mdmaAyUIvxE8WT_GEbF2wQ

  3. 工程是 2025 年最具韧性的岗位
    SignalFire 追踪 8000 万家公司数据发现,大型科技公司工程岗招聘仅降 11%(总招聘降 25%),早期初创公司工程师招聘增长 7%。
    https://techcrunch.com/2026/06/24/ai-was-supposed-to-kill-engineering-jobs-but-new-data-suggests-theyre-the-most-resilient

  4. OpenRouter 零数据留存实践:97 款新模型,流量占比近半
    ZDR 保证用户提示词和模型响应不被存储,自 1 月以来新增 97 款支持 ZDR 的模型,月度 token 量增长 4.3 倍。
    https://openrouter.ai/blog/insights/when-zero-means-zero

  5. NVIDIA NeMo AutoModel:一行代码加速 MoE 模型微调
    基于 Transformers v5 的开源库,MoE 模型训练吞吐量提升 3.4-3.7 倍,GPU 内存减少 29-32%,仅需改动一行 import。
    https://huggingface.co/blog/nvidia/accelerating-fine-tuning-nvidia-nemo-automodel

  6. MiniCPM-V 4.6 在 Apple Core AI 上高速运行
    不到 2B 参数的多模态模型在设备端以令人印象深刻的速度运行,推动高效多模态 AI 发展。
    https://x.com/OpenBMB/status/2069676334381728106

Dejar un comentario

Comparte tus pensamientos. Los campos marcados con * son obligatorios.

Tu correo electrónico no se mostrará públicamente

Comentarios

0