AI HOT 日报 · 2026-06-25

AI HOT 日报 · 2026-06-25

模型发布/更新

OpenAI ChatGPT 语音最大规模升级：双向AI语音模型 Bidi 1 已上线测试
部分用户发现 ChatGPT 上线了双向 AI 语音模型 Bidi 1，支持边说话边监听、中途打断并发出新指令。OpenAI 尚未官宣，预计本周更大范围测试。
https://www.ithome.com/0/967/852.htm
Qwen-AgentWorld 开源：让 Agent 学会"先预测，再行动"
通义千问推出首个原生语言世界模型 Qwen-AgentWorld，覆盖 MCP、Search、Terminal 等七大领域，基于超 1000 万条真实交互轨迹训练，在 AgentWorldBench 上超越 GPT-5.4 和 Claude Opus 4.8。
https://mp.weixin.qq.com/s/NV9WGpGsfFz35jww5agM9g
Gemini 3.5 Flash 内置计算机使用能力
Google 将 Computer Use 作为内置工具集成至 Gemini 3.5 Flash，开发者可构建跨浏览器、移动端和桌面的智能体，新增企业级安全保护：用户确认敏感操作、检测到提示注入自动停止。
https://blog.google/innovation-and-ai/models-and-research/gemini-models/introducing-computer-use-gemini-3-5-flash
GPT-5.5 Instant 新版本，对话更有趣
OpenAI 更新 GPT-5.5 Instant，能更好理解问题背后的意图，更可靠地处理复杂约束，购物和本地推荐更实用。今天向付费用户推送，明天向免费用户推送。
https://x.com/OpenAI/status/2069843083701915755

产品发布/更新

豆包正式推出专业版
基于豆包2.1系列大模型，面向复杂办公场景，支持操作本地电脑、浏览器、调用 Skills 技能、定时任务，内置 Office 套件。标准套餐 68 元/月，大学生认证后 38 元/月。
https://mp.weixin.qq.com/s/Sb-NMXTrWFQES1EDO_Gr2g
Figma Config 2026：画布扩展至代码、动画、3D
设计画布新增 Code Layers、Motion 动画、深度层、Shader 及 Generative Plugins。AI 功能依赖 Anthropic、OpenAI 等外部模型，推理成本挤压利润率。
https://the-decoder.com/figma-bets-on-human-judgment-at-config-2026-while-the-ai-powering-its-canvas-belongs-to-someone-else
火山引擎推出 Agent Ready 基础设施
AgentKit 升级提供 Identity、Runtime、Sandbox、Evaluation 模块，Runtime 支持长程任务和分钟级 12 万沙箱并发。海底捞门店经营 Agent 人工跟进时长缩减 70%。
https://mp.weixin.qq.com/s/83mrPAPgQRKhxLkoSvRgBQ
Notion 使用 Cursor SDK 嵌入编码智能体
用户可在文档中 @Cursor、在讨论串中提及或向数据库指派任务，Cursor 端到端完成规划、构建、测试并自动创建 PR。基于 Provider 无关的智能体框架。
https://cursor.com/blog/notion
Perplexity 推出 Computer for Counsel
连接律师日常使用的研究数据库、文档工具和案件管理系统，可提取可引用来源。Pro 和 Max 订阅用户可用。
https://x.com/perplexity_ai/status/2069866668671766804
Mistral AI Connectors 多项安全与可控新能力
新增 Enriched admin controls、API keys with connector scopes、Multi-account connectors、Connectors Debugger 等能力，支持按工作空间设置连接器访问权限。
https://mistral.ai/news/more-control-over-connectors
FFASR 排行榜发布：真实远场条件下 ASR 评测
Treble Technologies 与 Hugging Face 联合推出首个开源社区驱动的远场声学条件 ASR 评测基准，涵盖 14 种房间和三个信噪比级别。
https://huggingface.co/blog/ffasr-leaderboard
OpenAI 与 Broadcom 发布定制推理芯片 Jalapeño
专为 LLM 推理优化，旨在提升 AI 系统的性能、效率与规模。
https://openai.com/index/openai-broadcom-jalapeno-inference-chip

行业动态

NSA 因与 Anthropic 纠纷失去对 Mythos 系统访问权限
美国国家安全局因与 Anthropic 的纠纷，失去了对 Mythos 系统的访问权限。
https://www.nytimes.com/2026/06/23/us/politics/nsa-lost-access-anthropic-tool.html

论文研究

DFlash：块扩散草稿模型实现最高 15 倍吞吐量提升
UC San Diego 团队提出的投机解码方案，一次前向推理生成整块 token，在 NVIDIA Blackwell 上 gpt-oss-120b 吞吐量提升最高 15 倍。
https://www.marktechpost.com/2026/06/24/dflash-speculative-decoding-drafts-whole-token-blocks-in-parallel-for-up-to-15x-higher-throughput-on-nvidia-blackwell
思考即回忆：推理如何解锁 LLM 中的参数化知识
Google Research 发现 chain-of-thought 能帮助 LLM 回忆简单事实，即使无需复杂推导。推理 token 充当计算缓冲，相关事实起启动效应。
https://research.google/blog/thinking-to-recall-how-reasoning-unlocks-parametric-knowledge-in-llms

技巧与观点

里德·霍夫曼称 SpaceX 不是 AI 公司，xAI 是彻底灾难
LinkedIn 联合创始人公开批评 SpaceX 收购 Cursor 属于花钱买相关性，xAI 所有 11 位联合创始人已离职，Grok 模型落后于 Anthropic 和 OpenAI。
https://fortune.com/2026/06/24/reid-hoffman-spacex-musk-openai-anthropic-gen-z-mistake
字节跳动洪定坤：AI Coding 实践与探索
字节 AI 代码贡献率增长 6 倍，但人均需求吞吐率仅提升 60%。900 次实验显示主流模型代码正确率超 80%，可交付性仅 40-60 分；结合 Harness 基建后提升至 80 分。
https://mp.weixin.qq.com/s/mdmaAyUIvxE8WT_GEbF2wQ
工程是 2025 年最具韧性的岗位
SignalFire 追踪 8000 万家公司数据发现，大型科技公司工程岗招聘仅降 11%（总招聘降 25%），早期初创公司工程师招聘增长 7%。
https://techcrunch.com/2026/06/24/ai-was-supposed-to-kill-engineering-jobs-but-new-data-suggests-theyre-the-most-resilient
OpenRouter 零数据留存实践：97 款新模型，流量占比近半
ZDR 保证用户提示词和模型响应不被存储，自 1 月以来新增 97 款支持 ZDR 的模型，月度 token 量增长 4.3 倍。
https://openrouter.ai/blog/insights/when-zero-means-zero
NVIDIA NeMo AutoModel：一行代码加速 MoE 模型微调
基于 Transformers v5 的开源库，MoE 模型训练吞吐量提升 3.4-3.7 倍，GPU 内存减少 29-32%，仅需改动一行 import。
https://huggingface.co/blog/nvidia/accelerating-fine-tuning-nvidia-nemo-automodel
MiniCPM-V 4.6 在 Apple Core AI 上高速运行
不到 2B 参数的多模态模型在设备端以令人印象深刻的速度运行，推动高效多模态 AI 发展。
https://x.com/OpenBMB/status/2069676334381728106

AI HOT 日报 · 2026-06-25

模型发布/更新

产品发布/更新

行业动态

论文研究

技巧与观点

Herramientas Destacadas

Texto a Voz

Text to Speech Tool

¡Método Simple para Aprender Inglés!

Dejar un comentario

Comentarios