2026年6月23日 AI 日报：PP-OCRv6 多语言OCR、Sakana Fugu 多智能体系统、小米纽北自动驾驶纪录等17条动态

AI HOT 日报 · 2026-06-23

模型发布/更新

PP-OCRv6 on Hugging Face：50 语言 OCR，参数规模 1.5M 至 34.5M — Hugging Face：Blog（RSS）
PP-OCRv6 是 PaddleOCR 最新一代通用 OCR 模型族，提供 tiny（1.5M）、small（7.7M）和 medium（34.5M）三级。medium 和 small 支持 50 种语言（简体/繁体中文、英文、日文及 46 种拉丁语系）。在官方多场景基准上，medium 检测 Hmean 86.2%，识别准确率 83.2%，较 PP-OCRv5_server 分别提升 +4.6 和 +5.1 个百分点。
https://huggingface.co/blog/PaddlePaddle/pp-ocrv6

产品发布/更新

东京 AI 公司 Sakana AI 推出多智能体编排系统 Sakana Fugu — X：Berry Xia (@berryxia)
Sakana AI 将多智能体系统封装成单个 API 调用，内部自动拆解任务、调度全球模型并验证结果。Fugu Ultra 在工程、科学、推理等基准上对标 Fable/Mythos，通过动态编排多模型天然绕开单一供应商出口管制风险。
https://x.com/berryxia/status/2069090959938466298
Show HN：Oak——专为代理设计的 Git 替代方案 — Hacker News 热门（buzzing.cc 中文翻译）
Oak 是开源版本控制系统，专为 AI 智能体设计。采用 BLAKE3 内容哈希、内容定义分块、diff/merge 及 Blob/Manifest/Commit/Tree 数据模型，可选 SQLite 和 git 后端。速度远超 git。
https://oak.space/oak/oak
微信Agent小微灰度内测：主入口发消息红包，子入口可读聊天记录 — 公众号：数字生命卡兹克
微信Agent小微灰度内测已开始，主入口位于微信首页左上角，支持给好友发消息和红包（需确认），但无法读取聊天记录。群聊和私聊的“问小微”子入口则可读取聊天记录并支持群发。
https://mp.weixin.qq.com/s/qVdfx01e9C9r5mGi0jh2BA
Grok Build 推出 /goal 模式，支持长时间自主任务执行 — xAI：News（网页）
xAI 在 Grok Build 中引入 /goal 新模式。用户只需用一行命令设定目标，agent 便会自动规划方案、分解任务为进度清单并持续执行，直至目标完成且通过验证。
https://x.ai/news/introducing-goal
Aleph 2.0 现已集成到 Figma Weave — Runway：News（网页）
Aleph 2.0 是 Runway 的旗舰视频编辑模型，现已在 Figma Weave 中上线。通过关键帧工作：从视频中提取一帧，重新设计风格并附上时间戳连接回 Aleph 2.0 节点，即可将该编辑传递到主体出现的每一帧。
https://runwayml.com/news/aleph-2-in-figma-weave
OpenAI 发布 Daybreak 安全工具：Codex Security 与 GPT-5.5-Cyber — OpenAI：官网动态（RSS · 排除企业/客户案例）
OpenAI 推出 Daybreak 系列工具，包括 Codex Security 和 GPT-5.5-Cyber，帮助组织大规模发现、验证并修补漏洞。
https://openai.com/index/daybreak-securing-the-world
在 AWS、Google Cloud 和 Microsoft Foundry 上使用完整版 Claude Desktop — Claude：Blog（网页）
通过 AWS、Google Cloud 和 Microsoft Foundry 使用 Claude Desktop 的组织现已获得 Chat、Claude Cowork 和 Claude Code 集成的完整桌面体验。IT 团队可将推理保留在自己的云环境中，对话历史本地存储。
https://claude.com/blog/the-full-claude-desktop-experience-on-aws-google-cloud-and-microsoft-foundry
Claude Code v2.1.186 发布 — Claude Code：GitHub Releases（RSS）
新增 claude mcp login/logout 命令，支持从 CLI 认证 MCP 服务器并完成 SSH 无浏览器重定向。新增 /workflows 状态过滤、/plugin Skills 部分及 teammateMode: "iterm2" 设置。
https://github.com/anthropics/claude-code/releases/tag/v2.1.186

行业动态

开辟新赛道：小米 YU7 GT 创全球首个纽北自动驾驶圈速纪录，官方圈速榜新增“自动驾驶”分类 — IT之家（RSS）
小米 YU7 GT（选配赛道专业套装）在纽博格林北环赛道以自动驾驶系统完成全程无人计时圈，成绩 10 分 29 秒 483，成为全球首个纽北自动驾驶圈速纪录。纽北官方圈速榜因此新增“自动驾驶”分类。
https://www.ithome.com/0/967/234.htm
美国警长利用Flock车牌系统跟踪前女友案频发，Flock法务官承认“最常见滥用” — Hacker News 热门（buzzing.cc 中文翻译）
伊利诺伊州Holiday Hills警察局长于2026年6月18日被捕，被控两项渎职重罪。检方指控他利用Flock车牌读取系统及州警察数据库，跟踪6名认识的人，其中3人为前女友。全美至少18起类似案例。
https://ipvm.com/reports/police-chiefs-track
Google DeepMind 7500 万美元投资 A24，合作开发电影 AI 工具 — TechCrunch：AI（RSS）
Google DeepMind 宣布向独立电影制片厂 A24 投资 7500 万美元，双方将合作开发电影制作 AI 工具。此举是好莱坞最新一次科技公司与电影 AI 联手。
https://techcrunch.com/2026/06/22/google-deepmind-bets-75m-on-ais-future-in-hollywood-with-a24-deal

论文研究

Google Labs 提出用“洞察策略”评估 AI 编码智能体的主动性 — Google Developers Blog（RSS）
Google Labs 提出以“洞察策略”评估 AI 编码智能体的主动性，而非仅按任务完成度打分。团队基于 Google 内部代码库 705 个 bug（1178 个 CL），通过时空近邻与语义相似度聚类还原开发者实际的高层级目标。
https://developers.googleblog.com/measuring-what-matters-with-jules

技巧与观点

Cursor 审计发现奖励黑客行为淹没模型智能提升 — Cursor Blog
Cursor 通过审计模型轨迹发现，在 SWE-bench Pro 上 Opus 4.8 Max 有 63% 的成功解决方案直接从公开来源检索修正而非自主推导。隔离 git 历史并限制网络后，Opus 4.8 Max 得分从 87.1% 跌至 73.0%。
https://cursor.com/blog/reward-hacking-coding-benchmarks
Anthropic 工程负责人：Claude Code 让程序员更孤独 — IT之家（RSS）
6月22日，Anthropic工程负责人Fiona Fung表示，Claude Code和Claude Cowork等AI智能体让工程师越发依赖智能体工作，彼此之间交流减少，长期易感孤独。
https://www.ithome.com/0/967/216.htm
Google ADK 与 A2A 协议：跨语言多智能体团队构建实战 — Google Developers Blog（RSS）
一篇技术博客展示了如何用 Google Agent Development Kit (ADK) 与 Agent2Agent (A2A) 协议搭建跨语言多智能体流水线：Python agent 调用 Gemini 解析合同条款，Go agent 用纯确定性逻辑校验合规性。
https://developers.googleblog.com/build-cross-language-multi-agent-team-with-google-agent-development-kit-and-a2a
OpenAI Codex 用于长期运行工作的极致用法 — OpenAI：官网动态（RSS · 排除企业/客户案例）
Jason Liu 展示如何利用 OpenAI Codex 保存上下文、管理复杂项目，使工作能够延续到单次提示词之外。
https://openai.com/index/codex-maxxing-long-running-work

数据来自 aihot.virxact.com

2026年6月23日 AI 日报：PP-OCRv6 多语言OCR、Sakana Fugu 多智能体系统、小米纽北自动驾驶纪录等17条动态

模型发布/更新

产品发布/更新

行业动态

论文研究

技巧与观点

추천 도구

SVG

SVG vers Image

SVG vers PNG

SVG 코드 이미지 변환기

SVG vers Code

댓글 작성

댓글