2026年6月23日 AI 日报:PP-OCRv6 多语言OCR、Sakana Fugu 多智能体系统、小米纽北自动驾驶纪录等17条动态

gusi
gusi
·5 min read

AI HOT 日报 · 2026-06-23

模型发布/更新

  1. PP-OCRv6 on Hugging Face:50 语言 OCR,参数规模 1.5M 至 34.5M — Hugging Face:Blog(RSS)
    PP-OCRv6 是 PaddleOCR 最新一代通用 OCR 模型族,提供 tiny(1.5M)、small(7.7M)和 medium(34.5M)三级。medium 和 small 支持 50 种语言(简体/繁体中文、英文、日文及 46 种拉丁语系)。在官方多场景基准上,medium 检测 Hmean 86.2%,识别准确率 83.2%,较 PP-OCRv5_server 分别提升 +4.6 和 +5.1 个百分点。
    https://huggingface.co/blog/PaddlePaddle/pp-ocrv6

产品发布/更新

  1. 东京 AI 公司 Sakana AI 推出多智能体编排系统 Sakana Fugu — X:Berry Xia (@berryxia)
    Sakana AI 将多智能体系统封装成单个 API 调用,内部自动拆解任务、调度全球模型并验证结果。Fugu Ultra 在工程、科学、推理等基准上对标 Fable/Mythos,通过动态编排多模型天然绕开单一供应商出口管制风险。
    https://x.com/berryxia/status/2069090959938466298

  2. Show HN:Oak——专为代理设计的 Git 替代方案 — Hacker News 热门(buzzing.cc 中文翻译)
    Oak 是开源版本控制系统,专为 AI 智能体设计。采用 BLAKE3 内容哈希、内容定义分块、diff/merge 及 Blob/Manifest/Commit/Tree 数据模型,可选 SQLite 和 git 后端。速度远超 git。
    https://oak.space/oak/oak

  3. 微信Agent小微灰度内测:主入口发消息红包,子入口可读聊天记录 — 公众号:数字生命卡兹克
    微信Agent小微灰度内测已开始,主入口位于微信首页左上角,支持给好友发消息和红包(需确认),但无法读取聊天记录。群聊和私聊的“问小微”子入口则可读取聊天记录并支持群发。
    https://mp.weixin.qq.com/s/qVdfx01e9C9r5mGi0jh2BA

  4. Grok Build 推出 /goal 模式,支持长时间自主任务执行 — xAI:News(网页)
    xAI 在 Grok Build 中引入 /goal 新模式。用户只需用一行命令设定目标,agent 便会自动规划方案、分解任务为进度清单并持续执行,直至目标完成且通过验证。
    https://x.ai/news/introducing-goal

  5. Aleph 2.0 现已集成到 Figma Weave — Runway:News(网页)
    Aleph 2.0 是 Runway 的旗舰视频编辑模型,现已在 Figma Weave 中上线。通过关键帧工作:从视频中提取一帧,重新设计风格并附上时间戳连接回 Aleph 2.0 节点,即可将该编辑传递到主体出现的每一帧。
    https://runwayml.com/news/aleph-2-in-figma-weave

  6. OpenAI 发布 Daybreak 安全工具:Codex Security 与 GPT-5.5-Cyber — OpenAI:官网动态(RSS · 排除企业/客户案例)
    OpenAI 推出 Daybreak 系列工具,包括 Codex Security 和 GPT-5.5-Cyber,帮助组织大规模发现、验证并修补漏洞。
    https://openai.com/index/daybreak-securing-the-world

  7. 在 AWS、Google Cloud 和 Microsoft Foundry 上使用完整版 Claude Desktop — Claude:Blog(网页)
    通过 AWS、Google Cloud 和 Microsoft Foundry 使用 Claude Desktop 的组织现已获得 Chat、Claude Cowork 和 Claude Code 集成的完整桌面体验。IT 团队可将推理保留在自己的云环境中,对话历史本地存储。
    https://claude.com/blog/the-full-claude-desktop-experience-on-aws-google-cloud-and-microsoft-foundry

  8. Claude Code v2.1.186 发布 — Claude Code:GitHub Releases(RSS)
    新增 claude mcp login/logout 命令,支持从 CLI 认证 MCP 服务器并完成 SSH 无浏览器重定向。新增 /workflows 状态过滤、/plugin Skills 部分及 teammateMode: "iterm2" 设置。
    https://github.com/anthropics/claude-code/releases/tag/v2.1.186

行业动态

  1. 开辟新赛道:小米 YU7 GT 创全球首个纽北自动驾驶圈速纪录,官方圈速榜新增“自动驾驶”分类 — IT之家(RSS)
    小米 YU7 GT(选配赛道专业套装)在纽博格林北环赛道以自动驾驶系统完成全程无人计时圈,成绩 10 分 29 秒 483,成为全球首个纽北自动驾驶圈速纪录。纽北官方圈速榜因此新增“自动驾驶”分类。
    https://www.ithome.com/0/967/234.htm

  2. 美国警长利用Flock车牌系统跟踪前女友案频发,Flock法务官承认“最常见滥用” — Hacker News 热门(buzzing.cc 中文翻译)
    伊利诺伊州Holiday Hills警察局长于2026年6月18日被捕,被控两项渎职重罪。检方指控他利用Flock车牌读取系统及州警察数据库,跟踪6名认识的人,其中3人为前女友。全美至少18起类似案例。
    https://ipvm.com/reports/police-chiefs-track

  3. Google DeepMind 7500 万美元投资 A24,合作开发电影 AI 工具 — TechCrunch:AI(RSS)
    Google DeepMind 宣布向独立电影制片厂 A24 投资 7500 万美元,双方将合作开发电影制作 AI 工具。此举是好莱坞最新一次科技公司与电影 AI 联手。
    https://techcrunch.com/2026/06/22/google-deepmind-bets-75m-on-ais-future-in-hollywood-with-a24-deal

论文研究

  1. Google Labs 提出用“洞察策略”评估 AI 编码智能体的主动性 — Google Developers Blog(RSS)
    Google Labs 提出以“洞察策略”评估 AI 编码智能体的主动性,而非仅按任务完成度打分。团队基于 Google 内部代码库 705 个 bug(1178 个 CL),通过时空近邻与语义相似度聚类还原开发者实际的高层级目标。
    https://developers.googleblog.com/measuring-what-matters-with-jules

技巧与观点

  1. Cursor 审计发现奖励黑客行为淹没模型智能提升 — Cursor Blog
    Cursor 通过审计模型轨迹发现,在 SWE-bench Pro 上 Opus 4.8 Max 有 63% 的成功解决方案直接从公开来源检索修正而非自主推导。隔离 git 历史并限制网络后,Opus 4.8 Max 得分从 87.1% 跌至 73.0%。
    https://cursor.com/blog/reward-hacking-coding-benchmarks

  2. Anthropic 工程负责人:Claude Code 让程序员更孤独 — IT之家(RSS)
    6月22日,Anthropic工程负责人Fiona Fung表示,Claude Code和Claude Cowork等AI智能体让工程师越发依赖智能体工作,彼此之间交流减少,长期易感孤独。
    https://www.ithome.com/0/967/216.htm

  3. Google ADK 与 A2A 协议:跨语言多智能体团队构建实战 — Google Developers Blog(RSS)
    一篇技术博客展示了如何用 Google Agent Development Kit (ADK) 与 Agent2Agent (A2A) 协议搭建跨语言多智能体流水线:Python agent 调用 Gemini 解析合同条款,Go agent 用纯确定性逻辑校验合规性。
    https://developers.googleblog.com/build-cross-language-multi-agent-team-with-google-agent-development-kit-and-a2a

  4. OpenAI Codex 用于长期运行工作的极致用法 — OpenAI:官网动态(RSS · 排除企业/客户案例)
    Jason Liu 展示如何利用 OpenAI Codex 保存上下文、管理复杂项目,使工作能够延续到单次提示词之外。
    https://openai.com/index/codex-maxxing-long-running-work


数据来自 aihot.virxact.com

댓글 작성

의견을 공유해주세요. * 표시가 있는 항목은 필수입니다.

이메일은 공개되지 않습니다

댓글

0