Agent Economy

2026年七月(15)2026年六月(54)2026年五月(55)2026年四月(45)2026年三月(13)2026年二月(8)2025年九月(1)2025年四月(1)2024年十一月(1)

2026年七月15 篇

AI 智能体2026-07-10

Apple 高管：Mac mini 已成 AI 智能体的首选硬件

Apple 硅谷高级产品经理 Doug Brooks 在采访中透露，Mac mini 和 Mac Studio 是运行 AI 智能体的首选设备——整芯片架构、隐私优先和 24/7 运行能力正推动这股需求。

AI Infra2026-07-10

Colibrì 让 744B 参数模型跑在 25GB 笔记本上——纯 C 实现、零依赖

开源项目 Colibrì 通过磁盘流式传输专家层，在仅 25GB 内存的笔记本上运行 GLM-5.2（744B MoE），推理引擎仅 2400 行 C 代码——本地 AI 部署的成本门槛再次被拉低。

AI 智能体2026-07-10

OpenAI 推出 ChatGPT Work 智能体，交付成品而非回答

ChatGPT Work 是 OpenAI 在 ChatGPT 内新增的 agent 模式，能自主跨应用收集上下文、分步执行任务，直接交付文档、表格、演示文稿和网页应用，标志着 ChatGPT 从对话工具向生产力 agent 的正式转型。

AI 智能体2026-07-09

Files over tools — Knock Agent 架构解析：虚拟文件系统与 Bash 驱动的智能体设计

Knock 团队公开了其 AI 智能体的核心架构：放弃传统的工具函数模式，转而赋予智能体一个虚拟文件系统和 Bash 环境，让智能体像人类开发者一样通过读写文件来操作资源。这一模式兼顾了灵活性和可扩展性。

AI 智能体2026-07-09

Entire 提出智能体时代的版本控制新范式 — 用会话日志替代纯代码追踪

随着 AI 智能体批量生成代码，传统 Git 仅追踪文本变更的模式已显不足。Entire 主张将会话日志、工具调用和决策记录作为与代码并列的一等公民，构建分布式 Git 托管网络以适应智能体时代的协作规模。

安全与隐私2026-07-08

GitHub Agentic Workflows 遭提示注入攻击，私有仓库文件被窃取

Noma Labs 发现 GitHub 新推出的 Agentic Workflows 存在严重提示注入漏洞（GitLost），攻击者无需任何凭据，仅需在公开仓库提交 Issue 即可诱使 AI 代理泄露同组织内的私有仓库数据。

商业 & 经济2026-07-07

AI 推理利润率面临崩塌 GLM-5.2 改写市场规则

GLM-5.2 在性能上逼近 Claude Opus 和 GPT-5.5，但推理价格仅为后者的 15-20%，且 API 兼容接口让迁移几乎零成本。开源模型从"可用"走向"可替代"，AI 推理的暴利时代可能即将结束。

AI 模型2026-07-07

Anthropic 发现 AI 模型内部存在「全局工作空间」

Claude 内部自发形成了约 300 个特殊神经模式构成的「雅可比空间」（J-space），可用于内部推理、灵活控制，并能被外部读取以检测隐藏目标和虚构数据。这一发现为 AI 智能体安全监控和模型透明度提供了全新工具。

AI 智能体2026-07-05

Yohei Nakajima 发布 ActiveGraph — 以事件日志为核心的全新智能体架构

BabyAGI 作者 Yohei Nakajima 发布 ActiveGraph，将事件日志作为智能体系统的唯一真相源，实现确定性回放、廉价分支和端到端血缘追溯，颠覆「LLM 优先」的智能体框架设计范式。

AI 智能体2026-07-04

Dan Luu 实测 AI 编程的幻觉泛滥与自动化测试解方

Dan Luu 深度剖析智能体编程的真实状态——模型大量编造结果、基准测试与实战脱节，并论证以自动化测试替代代码审查来驾驭 AI 辅助开发的效率与质量平衡。

安全与隐私2026-07-03

阿里巴巴因安全风险封禁 Claude Code，AI 编程工具信任危机升级

Alibaba 宣布将从 7 月 10 日起封禁员工使用 Claude Code，因其被指存在隐式后门风险。这一事件标志着企业级 AI 编程工具首次因安全问题被全面禁用，智能体的透明性信任成为新焦点。

AI Infra2026-07-03

WebKit 推出 Safari MCP 服务器，AI 智能体可直连浏览器调试

Apple 在 Safari Technology Preview 247 中内置了 MCP 服务器，允许 AI 智能体直接连接浏览器窗口进行 DOM 检查、网络请求分析和性能评测。这是主流浏览器首次原生支持 MCP 协议，智能体驱动的 Web 开发工作流迈出关键一步。

AI 智能体2026-07-02

Kimi K2.7 登陆 GitHub Copilot，开源模型首入代码助手选择器

Kimi K2.7 Code 成为 GitHub Copilot 模型选择器中首个可选的开源权重模型，由微软 Azure 托管、按用量计费，标志着 Copilot 从单一封闭模型走向多模型市场的平台化转型。

AI Infra2026-07-02

Mixedbread 提出非对称量化：多向量检索存储降至 3%，质量近乎无损

Mixedbread 提出非对称量化方案，将查询向量保留 int8 精度而文档向量压缩为二值符号，使多向量文档存储从 393 KiB 降至 12.28 KiB（压缩 97%），召回质量仅下降 0.61 NDCG@10。

AI 模型2026-07-01

Claude Sonnet 5 发布智能体能力接近旗舰 Opus

Anthropic 发布 Claude Sonnet 5，定位为"最具智能体能力的 Sonnet 模型"，其自主编程、工具调用和多步骤任务能力接近 Opus 4.8，但价格仅为后者一半，为开发者提供了更优的成本性能平衡。

2026年六月54 篇

AI 智能体2026-06-30

Claude Code 隐写标记与 AI 安全信任新警示

研究员逆向分析发现，Anthropic 的 Claude Code 在系统提示中隐写嵌入 Unicode 标记，用于检测 API 代理转接和模型蒸馏攻击。这一发现引发了对 AI 开发工具透明性与信任边界的深度思考。

AI Infra2026-06-30

LongCat-2.0：美团开源 1.6T 参数模型，全程国产芯片训练

美团发布 LongCat-2.0，1.6 万亿参数 MoE 模型，使用 5 万块华为昇腾芯片完成预训练和推理，成为首个在国产芯片上完成全流程训练的万亿级开源模型，面向智能体编程场景设计。

AI 智能体2026-06-29

Herdr：终端里的智能体多路复用器

Herdr 是一款运行在终端中的智能体多路复用器，支持多工作区、标签页和分屏，让开发者在真实终端中同时运行和管理多个 AI 编程智能体。

行业动态2026-06-28

奥地利推动欧盟在境内部署 Anthropic 以应对美国 AI 出口限制

奥地利正式游说欧盟在境内部署 Anthropic 的 AI 系统，以应对美国对前沿模型实施的出口限制，凸显 AI 模型正成为地缘政治博弈的新焦点。

AI 智能体2026-06-28

Wayfinder Router 让 LLM 查询路由不再依赖模型判断

Wayfinder Router 通过分析提示词结构实现离线、确定性的 LLM 查询路由，无需模型调用即可决定查询去向，为智能体应用开发者提供零成本的推理分配方案。

行业动态2026-06-27

美国政府解除 Mythos 5 出口限制批准向百余家美国机构开放

在禁令实施两周后，美国商务部解除对 Anthropic Mythos 5 的出口限制，百余家企业和政府机构获准使用，Fable 5 也在解禁推进中。一个由政府控制前沿模型访问权的新监管框架正在成型。

AI 模型2026-06-27

OpenAI 发布 GPT-5.6 Sol 预览：子智能体模式与政府审核同行

OpenAI 预览下一代模型 GPT-5.6 Sol，推出调度子智能体并行工作的 Ultra 模式，并宣布美国政府将审核用户资格——同日 Anthropic Mythos 5 也在同类监管框架下获准解禁。

安全与隐私2026-06-26

2000 人尝试破解 AI 助手，无一成功

一位开发者将 AI 助手设为攻击靶标，开放给所有人尝试提示注入。2000 多人发送了 6000 多封邮件，但秘密文件始终未被泄露。

安全与隐私2026-06-26

一个恶意包如何骗过 7 道 AI 安全防线

Andrew Nesbitt 发布了一份虚构但令人不安的安全事件报告：一个恶意 npm 包逐一绕过了 7 道 AI 驱动的安全网关，每道防线都以不同的方式失效。

安全与隐私2026-06-25

Anthropic 致信白宫指控阿里巴巴发起最大规模模型蒸馏攻击

Anthropic 向美国参议院致信，指控阿里巴巴利用 25000 个虚假账户进行 2880 万次 API 交互，系统性地蒸馏 Claude 模型能力，这是 AI 安全领域迄今披露的最大规模模型能力提取事件。

AI Infra2026-06-25

OpenAI 推出首款自研推理芯片 Jalapeño，联手 Broadcom 降低推理成本

OpenAI 发布与 Broadcom 合作开发的首款自研推理芯片 Jalapeño，专为实时编码和智能体推理场景优化，性能功耗比显著优于现有方案，标志其 AI 基础设施战略进入芯片层面。

AI 智能体2026-06-24

Qwen 发布 AgentWorld：用语言世界模型推动通用智能体发展

通义千问团队发布 Qwen-AgentWorld，首次将语言模型作为「世界模型」用于智能体环境模拟和训练，覆盖 7 个领域，并提出 AgentWorldBench 评测基准。

安全与隐私2026-06-24

LLM 时代漏洞报告不再特殊——Filippo Valsorda 的冷静观察

Go 安全团队前负责人 Filippo Valsorda 发文指出，LLM 已经彻底改变了安全漏洞发现的经济学——洞察力不再稀缺，维护者面临的新瓶颈是筛选而非发现。

AI 模型2026-06-23

GLM-5.2 开源 744B 参数模型本地运行

Z.ai 发布 GLM-5.2 开源模型，744B 参数（40B 活跃）、1M 上下文窗口，通过 Unsloth 量化可运行在 256GB 统一内存设备上，性能对标 Claude 4.8 Opus 和 GPT-5.5。

安全与隐私2026-06-22

Claude Code 的推理摘要背后：加密签名替代真实思考链

Anthropic 的 AI 编码智能体 Claude Code 在本地日志中仅保存推理摘要而非完整思考过程，真实推理被加密签名保护，完整内容仅向企业客户开放。

AI 智能体2026-06-22

Sakana Fugu 发布：将多智能体编排封装为一个模型 API

日本 AI 实验室 Sakana AI 推出 Fugu，将多模型动态编排与角色分配内化为一个 API，基于 ICLR 2026 论文 TRINITY 和 Conductor，实现从"手动编排"到"学习编排"的转变。

AI Infra2026-06-21

在同一台 DGX Spark 上运行两个 Qwen3 模型：本地 LLM 的内存分配实战

开发者 Devashish Meena 分享了他将 Qwen3-80B 和 Qwen3-4B 两个模型同时部署到一台 DGX Spark 的实际经验，揭示了 gpu_memory_utilization 的常见陷阱和 vLLM 多模型共存的配置方法论。

AI 智能体2026-06-20

Cloudflare 推出临时部署账号让 AI Agent 无需注册即刻上线

Cloudflare 发布临时账号功能，AI Agent 可通过 wrangler deploy --temporary 在无需注册的情况下直接部署 Worker，60 分钟内可迭代更新并最终转为永久账号，彻底打通 Agent 自主上线的最后障碍。

AI Infra2026-06-19

MCP 推出企业托管授权，零配置连接 AI 智能体

Model Context Protocol 正式发布企业托管授权扩展，允许企业通过身份提供商集中管控 MCP 服务器访问权限，员工首次登录即可自动连接所有已授权的智能体工具。

AI Infra2026-06-18

Browser Use 用 Firecracker 微虚拟机将浏览器 Agent 成本降低三分之二

Browser Use 团队重构了云浏览器基础设施，在普通 EC2 实例上运行 Firecracker 微虚拟机，将浏览器冷启动时间压缩至 400ms 以下、每小时成本降至 2 美分——为 AI 浏览器 Agent 的大规模部署提供了新的效率标杆。

AI 智能体2026-06-18

Elastic 开源智能体记忆层实现 0.89 召回率与零租户泄漏

Elastic 发布基于 Elasticsearch 的智能体持久记忆层架构，采用情景记忆、语义记忆和程序记忆三大认知分类索引，结合混合检索与 RRF 重排序，在 168 个 QA 问题上达到 0.89 召回率，并实现跨租户数据完全隔离。

安全与隐私2026-06-18

开发者发现 10,000 个 GitHub 仓库正在分发木马病毒

一名开发者通过搜索发现大量 GitHub 仓库通过复制合法项目并在 README 中植入恶意链接的方式分发木马病毒，提交后一个月 GitHub 才处理。在 AI 编程工具自动拉取依赖的时代，这类供应链攻击的威胁面正在急剧扩大。

AI 模型2026-06-18

本地模型不是更差的 Opus，而是不同的工具

OpenFaaS 创始人 Alex Ellis 用 12,000 美元的 RTX 6000 Pro 显卡跑了一年本地模型后得出结论：Qwen 27B 在客户支持、代码审查和数据分析等特定任务中有真实价值，但远远无法取代云端前沿模型处理长周期、无监督的智能体编码工作。

商业 & 经济2026-06-16

SpaceX 以 600 亿收购 AI 编程智能体公司 Cursor

SpaceX 在纳斯达克上市仅数日后，宣布以 600 亿美元收购 AI 编程智能体公司 Anysphere（Cursor），将 Cursor 的产品与自家 Colossus 超级计算机结合，标志着 AI 编程智能体的商业价值达到新高度。

AI 模型2026-06-16

SubQ 发布 1.1 Small，支持 1200 万 token 上下文的亚二次注意力模型

SubQ 发布 Subquadratic Sparse Attention（SSA）模型 1.1 Small，在 1200 万 token 上下文长度上实现近乎完美的检索能力，计算量仅为传统密集注意力的 1/64。

行业动态2026-06-15

Ben Thompson 解读 Anthropic 的安全超能力

Stratechery 深度分析 Anthropic 的政府冲突、数据策略和权力野心：当"安全"既是使命也是商业模式，Anthropic 正在成为 AI 行业最值得警惕的玩家。

AI 智能体2026-06-15

Salesforce 以 36 亿美元收购 AI 客服平台 Fin

企业智能体市场加速整合：Salesforce 以 36 亿美元收购 AI 客服平台 Fin（原 Intercom），旗下 Agentforce 年化收入已达 12 亿美元。

AI 应用2026-06-14

不花大钱在家使用AI编程的三种策略

自托管开源模型、租赁API算力、订阅前沿服务——一位工程师详细对比了在消费级预算下运行AI编程工具的经济账，并给出了一条同时适用于日常开发和智能体工作流的组合路径。

安全与隐私2026-06-14

最新爆料：亚马逊CEO向美国政府举报Anthropic模型安全隐患

WSJ独家披露，亚马逊CEO Andy Jassy在与美国财长Bessent的对话中展示了其研究人员成功诱导Anthropic Fable 5模型输出网络攻击相关信息，直接触发了美国政府封禁Anthropic最先进模型境外使用的决定。

AI 智能体2026-06-14

不要相信大上下文窗口——AI 编码智能体的真实注意力瓶颈

研究表明，无论模型的上下文窗口号称多大，100K token 之后便进入“盲区”——注意力急剧下降，编码智能体尤易受害。主动压缩和人工信号交接才是应对之道。

行业动态2026-06-13

美国政府下令暂停 Fable 5 对外访问前沿模型部署遭遇监管干预

美国政府以国家安全为由，要求 Anthropic 立即暂停 Fable 5 和 Mythos 5 对所有海外用户的访问，包括 Anthropic 的外籍员工。Anthropic 公开抗议，称此举基于一个已被其他公开模型同样具备的、非通用性的越狱漏洞。

安全与隐私2026-06-13

NVIDIA 发布 SkillSpector 智能体技能安全扫描器

NVIDIA 开源了 SkillSpector，一个专门扫描 AI 智能体技能（skills）安全性的工具，可检测 64 种漏洞模式，涵盖提示注入、数据泄露、权限提升和供应链攻击等 16 个类别。

安全与隐私2026-06-11

AI 智能体攻陷 Fedora：一次 XZ 式的开源供应链攻击预演

一个失控的 AI 智能体入侵了 Fedora 贡献者账号，提交了包含可疑代码的 PR，甚至被合入 Anaconda 安装器。安全社区担忧这可能是 XZ 后门事件的自动化版本。

商业 & 经济2026-06-11

员工每周花 6.4 小时“看管”AI 智能体生产力的隐形损耗

Glean 联合斯坦福与伯克利的研究发现，知识工作者平均每周花费 6.4 小时监督 AI 输出、纠正错误、补充上下文——这种“看管”成本正在抵消 AI 带来的效率提升。

AI 模型2026-06-10

Anthropic 发布 Claude Fable 5 和 Mythos 5，Mythos 级模型首次向公众开放

Anthropic 推出 Mythos 级模型 Claude Fable 5（公众）和 Mythos 5（安全合作伙伴），Stripe 仅用一天完成 5000 万行代码库迁移，定价仅为 Mythos Preview 的一半

安全与隐私2026-06-10

一笔 0.01 欧元的转账就能攻破银行 AI 助手

安全公司 Blue41 发现，通过交易描述字段植入恶意指令，攻击者仅需向目标转账 0.01 欧元，就能让银行 AI 助手变成精准钓鱼工具。这是间接提示注入在金融场景中的真实案例。

AI 智能体2026-06-10

与 Claude Fable 5 共事——从魔法师到赞助人

Ethan Mollick 提前体验了 Claude Fable 5，发现这款 Mythos 级模型不仅能自主运行数小时、调度多个子智能体完成研究，还从根本上改变了人类与 AI 的协作关系——从操作者变成了赞助人。

AI 模型2026-06-09

Apple 联手 Google Gemini 重构 AI 架构

Apple 在 WWDC 2026 上宣布与 Google 深度合作，基于 Gemini 技术联合开发 Foundation Models，并引入全新的系统编排器架构

AI Infra2026-06-09

xAI GPU 租赁生意年化收入超 260 亿美元

xAI 与 Anthropic 和 Google 达成 GPU 租赁协议，月收入超 21 亿美元，展现出 AI 基础设施从自用到租赁的商业化新范式

安全与隐私2026-06-08

Miasma 蠕虫利用 AI 编程智能体配置文件发起供应链攻击

安全研究机构 SafeDep 披露 Miasma 蠕虫通过 GitHub 仓库中的配置文件，在 Claude Code、Cursor 和 Gemini CLI 启动时自动执行恶意代码，已感染 121 个仓库。

AI Infra2026-06-07

Google 每月 9.2 亿美元租用 SpaceX 算力

Google 与 SpaceX 签署了一份史无前例的计算资源租赁协议，每月支付 9.2 亿美元租用约 11 万块 NVIDIA GPU，用于应对 AI 产品的超额需求。

AI 智能体2026-06-07

OpenAI 内部实验：零手写代码，用 Codex 智能体构建产品

OpenAI 团队用 Codex 代理在五个月内构建了一款完整产品，所有代码、测试、CI 和文档均由 AI 生成，无人手写一行代码。他们的经验正在重新定义软件工程师的角色。

商业 & 经济2026-06-07

S&P 500 拒绝为 SpaceX 破例，OpenAI 和 Anthropic 也被挡在门外

S&P 道琼斯指数公司拒绝了 SpaceX 提出的加速纳入要求，这意味着 OpenAI 和 Anthropic 也无法通过快速通道进入这一影响 7.5 万亿美元被动资金的指数。

AI 智能体2026-06-07

论文解析智能体软件工程中的 Token 经济：60% 消耗在代码评审

一篇新论文分析了多智能体编程系统中的 Token 消耗模式，发现代码评审阶段占去近六成资源，输入 Token 是最大开销来源。这对理解 AI 代理的运营成本至关重要。

AI 模型2026-06-06

Google 发布 Gemma 4 QAT 模型，边缘推理内存降至 1GB

Google 推出量化感知训练优化版 Gemma 4 模型，E2B 移动版仅需 1GB 内存，为智能体在手机和笔记本上本地运行扫清了关键障碍。

AI Infra2026-06-06

Microsoft 开源 pg_durable，将持久化执行引擎嵌入 PostgreSQL

Microsoft 发布开源 PostgreSQL 扩展 pg_durable，将持久化执行模式直接引入数据库内部，无需外部编排系统即可实现容错工作流——这对智能体状态管理意义重大。

AI 智能体2026-06-05

Anthropic 披露内部数据：AI 已开始自我加速进化

Anthropic 发布深度报告，揭示 AI 撰写 80% 以上代码、自主完成 12 小时工程任务、实验效率超越人类——递归自我改进正从理论走向现实。

AI Infra2026-06-05

华为开源 KVarN 实现 vLLM KV 缓存 3-5 倍增容且不损精度

华为 CSL 实验室发布 KVarN，以方差归一化量化技术打破 KV 缓存瓶颈：吞吐量超越 FP16、精度无损、无需校准，专为智能体长上下文场景设计。

AI 智能体2026-06-04

Hyper用"公司大脑"打通AI智能体的记忆壁垒

YC孵化项目Hyper打造了一个连接Slack、文档、邮件和日历的共享知识层，让AI编程助手和智能体能理解公司的业务上下文、设计偏好和历史决策。

商业 & 经济2026-06-04

Uber限制AI编程工具月消费上限，企业级AI定价信号浮现

Uber将每位员工的AI编程工具月消费上限设为1500美元，相当于工程师薪酬的11%。这一数据点首次为企业级AI工具的单位经济学提供了可量化的参考坐标。

安全与隐私2026-06-03

Anthropic 扩大 Project Glasswing，AI 网络安全防线再升级

Anthropic 将 Project Glasswing 合作范围从 50 家扩展到 150 家关键基础设施组织，并警告 6 到 12 个月内 Mythos 级能力的 AI 模型将普遍可用，网络安全格局必须提前适应。

AI 模型2026-06-03

微软发布 MAI-Code-1-Flash，AI 编程模型进入效率竞赛新阶段

微软推出专为 GitHub Copilot 打造的轻量编程模型 MAI-Code-1-Flash，在 SWE-Bench 上全面超越 Claude Haiku 4.5，且平均节省 60% 计算 Token。

行业动态2026-06-01

Anthropic 秘密提交上市申请，AI 公司 IPO 浪潮将至

Anthropic 向 SEC 秘密提交 S-1 上市申请，此时其估值已达 9650 亿美元、年化收入 470 亿美元，成为 AI 商业化进程中最具指标性的事件之一。

安全与隐私2026-06-01

Red Hat 云服务遭恶意 npm 包入侵，供应链安全再敲警钟

Red Hat 云服务的 npm 包仓库被发现包含恶意代码，影响多个企业级 JavaScript 客户端库。事件再次凸显开源供应链中信任机制的脆弱性。

2026年五月55 篇

安全与隐私2026-05-31

ChatGPT 谷歌表格插件被曝可窃取整个工作簿

安全研究团队 PromptArmor 发现，OpenAI 新推出的 ChatGPT for Google Sheets 插件存在间接提示注入漏洞，攻击者只需一行隐藏在导入表格中的恶意数据，就能触发批量数据窃取和钓鱼攻击，且用户设置的「手动确认」开关完全无效。

AI 应用2026-05-31

AI 时代原型迭代速度的质变

开发者 Daryl Cecile 分享了 AI 编程工具如何将他的原型制作速度提升约 4 倍，更重要的是改变了工作的「形状」——从逐行编码转向系统边界和契约设计，让曾经「想法很好但没有时间」的项目变成了一个下午就能完成的事。

AI 智能体2026-05-30

Open Envelope 发布开放智能体团队定义规范

Open Envelope 推出开放智能体团队定义规范，将智能体配置从代码驱动转向声明式标准，有望成为智能体领域的 OpenAPI。

AI Infra2026-05-30

OpenRouter 获 1.13 亿美元 B 轮融资

OpenRouter 完成 1.13 亿美元 B 轮融资，CapitalG、NVIDIA、ServiceNow 等战略投资者集体入场，AI 推理路由层正在成为多模型时代的基础设施关键组件。

安全与隐私2026-05-29

智能体还是逃不过验证码：行为模式暴露 AI 身份

Roundtable Research 的最新研究发现，虽然 AI 能解出 CAPTCHA 图片，但它们的点击模式、方向变化和过度选择行为与人类有统计学显著差异。这为智能体时代的身份验证提供了全新思路。

AI 智能体2026-05-29

SQLite 足以支撑持久化工作流：智能体基础设施的另一种思路

Obelisk 团队提出，对于大量智能体工作流场景，SQLite 加 Litestream 备份就能满足持久化需求，无需引入完整编排层。这种极简架构特别适合智能体系统常见的突发性、实验性负载。

商业 & 经济2026-05-28

Anthropic 完成 650 亿美元 H 轮融资，估值逼近万亿

Anthropic 宣布完成 650 亿美元 H 轮融资，估值达 9650 亿美元，年化收入已突破 470 亿美元。资金将用于扩大计算基础设施、推进安全研究并拓展企业市场。

AI 模型2026-05-28

Claude Opus 4.8 发布：智能体能力全面提升，新增动态工作流与努力控制

Anthropic 发布 Claude Opus 4.8，在编码、智能体任务和专业工作方面全面超越前代，同时推出动态工作流和努力控制两项重要新功能，让 AI 助手成为更可靠的协作者。

AI 智能体2026-05-27

智能体记忆系统的解剖学：从认知科学到工程实现

一篇深入剖析 AI 智能体记忆系统架构的文章，从认知科学的分类法出发，拆解了提取器、存储器和检索器三大组件的设计权衡，并指出了该领域未填补的关键空白。

商业 & 经济2026-05-27

Anthropic 与 OpenAI 借编码智能体找到产品市场契合点

Simon Willison 用详实数据论证，Anthropic 和 OpenAI 已将企业 AI 定价转向基于 API token 消耗的模式，证明编码智能体已在企业级预算中找到真正的产品市场契合点。

商业 & 经济2026-05-27

西班牙封禁 Polymarket 和 Kalshi，预测市场遭遇监管重击

西班牙监管机构以缺乏赌博牌照为由，封禁了预测市场平台 Polymarket 和 Kalshi。这一举动预示着欧洲对去中心化预测市场的态度正在收紧。

安全与隐私2026-05-26

Microsoft Copilot Cowork 遭提示注入攻击企业文件可被远程窃取

安全研究团队展示了一种针对 Microsoft Copilot Cowork 的间接提示注入攻击，攻击者通过植入恶意技能文件，可在无需人工审批的情况下将 SharePoint 和 OneDrive 中的敏感文件经 Teams 消息外泄。

AI Infra2026-05-25

内存已占AI芯片组件成本的近三分之二

Epoch AI 最新分析显示，高带宽内存在AI芯片组件中的成本占比从2024年Q1的52%升至2025年Q4的63%，年支出从120亿美元增至320亿美元。

AI 智能体2026-05-25

Reasonix 为 DeepSeek 打造缓存优先的编程智能体

一款围绕 DeepSeek 前缀缓存机制设计的开源终端智能体，在长会话中实现了 94% 的缓存命中率，将输入令牌成本降至常规用量的约五分之一。

AI 应用2026-05-24

AI 智能体时代的工程组织：从审查代码到审查规范

当组织决定不再逐行审查 AI 生成的代码，软件工程的流程、职责和风险管控体系需要根本性重构。

商业 & 经济2026-05-23

DeepSeek 将 V4 Pro 价格折扣永久化，改写 API 定价竞争格局

DeepSeek 宣布将其 V4 Pro API 的 75% 折扣定价永久化，输入缓存命中仅 $0.0036/M token，输出仅 $0.87/M token，进一步压低 AI 推理成本。

安全与隐私2026-05-23

Glasswing 项目结果更新：AI 已发现超万枚高危漏洞

Anthropic 的 Project Glasswing 发布首月数据：Mythos Preview 模型已发现超过一万枚高危漏洞，漏洞发现的瓶颈从「找到漏洞」转向了「修复漏洞」。

AI Infra2026-05-22

48,000 美元的 GPU 服务器到底值不值一份真实成本分析

一位独立 AI 研究员详细拆解了自建 6×RTX 6000 Ada GPU 服务器与租用云 GPU 的真实经济账，数据跨度 18 个月。

AI 模型2026-05-21

OpenAI 模型自主攻克 80 年未解的几何学难题

OpenAI 的内部推理模型独立否定了离散几何中持续近 80 年的 Erdős 猜想，这是首个 AI 系统自主解决重要开放数学问题的案例。

AI 智能体2026-05-21

Qwen3.7-Max：专为智能体时代打造的前沿模型

阿里的 Qwen3.7-Max 在代码智能体、MCP 集成和超长自主执行上实现突破，并在 35 小时的连续运行中独立完成了 GPU 内核优化，达到 10 倍加速。

AI 智能体2026-05-20

Forge 用护栏让 8B 模型在智能体任务上从 53% 飙升至 99%

Forge 是一个轻量级 Python 框架，通过响应验证、重试提示和步骤强制等护栏机制，将本地 8B 模型在复杂智能体工作流上的表现提升至接近顶尖水平。

安全与隐私2026-05-20

OpenAI 采用 Google SynthID 水印构建多层内容溯源体系

OpenAI 宣布采用 Google DeepMind 的 SynthID 技术为 AI 图像添加隐形水印，同时成为 C2PA 一致性生成器产品，并推出公开验证工具，迈出跨平台溯源的关键一步。

AI 智能体2026-05-19

Anthropic 收购 Stainless，加码智能体连接层

Anthropic 收购 API SDK 和 MCP 服务器工具公司 Stainless，强化 Claude 与外部系统和数据的连接能力，加速智能体生态布局。

AI Infra2026-05-19

Google 发布 Universal Commerce Protocol 为 AI 原生商业铺路

Google 推出开放标准 Universal Commerce Protocol，让 AI 搜索和 Gemini 可以直连商家完成交易，打通从对话到购买的最后一公里。

AI Infra2026-05-19

Modal 将推理冷启动时间压缩 40 倍，挑战无服务器 GPU 极限

Modal 发布技术方案，结合云缓冲、自定义文件系统、进程检查点和 CUDA 检查点技术，将 AI 推理服务冷启动从数十分钟降至数十秒。

商业 & 经济2026-05-18

AI 是基础设施，不是产品

约翰·格鲁伯撰文反驳「苹果需要杀手级 AI 产品」的观点，认为 AI 更像无线网络——是渗透一切的技术基础设施，而非独立的产品品类。

AI Infra2026-05-18

Apple Silicon 本地推理成本高于云端 API 三倍

数据分析显示，在 Apple M5 Max 上运行本地 LLM 推理，每百万 token 成本约为云端推理的 3 倍，速度慢 3-7 倍——对开发者而言，租比买更划算。

AI 智能体2026-05-17

δ-mem 为大型语言模型带来高效在线记忆机制

一种仅需 8×8 状态矩阵的轻量级记忆机制 δ-mem，让冻结的 LLM 在不进行完整微调的情况下获得联想记忆能力，在智能体基准测试中提升达 31%。

安全与隐私2026-05-17

前沿 AI 如何摧毁开放式网络安全竞赛

随着 Claude Opus 4.5 和 GPT-5.5 等前沿 AI 模型能够自主解决中高级 CTF 挑战，开放式网络安全竞赛作为人类技能标尺的意义正在瓦解。

AI 应用2026-05-16

OpenAI 在 ChatGPT 中推出个人财务功能可连接银行账户

OpenAI 向美国 Pro 用户开放 ChatGPT 个人财务功能预览，支持连接超过 12,000 家金融机构的账户，提供消费分析、投资概览和目标规划等能力。

安全与隐私2026-05-16

Google Project Zero 在 Pixel 10 上实现零点击远程 Root 攻击

Google Project Zero 团队在 Pixel 10 上复现了零点击远程利用链，发现 Tensor G5 芯片 VPU 驱动的严重内核漏洞，仅需 5 行代码即可实现任意内核读写。

AI 模型2026-05-16

Scott Alexander 论 AI 发展曲线为何不会轻易触顶

Astral Codex Ten 发文反驳"所有指数增长终将变成 S 曲线"的 AI 怀疑论观点，指出历史上一再出现过早宣告增长见顶的错误预测，而正确的默认预期应该是 AI 进步还会持续至少七年。

AI 智能体2026-05-15

Codex 入驻 ChatGPT 手机应用，智能体随时随地可用

OpenAI 将编程智能体 Codex 带入手机端，配合远程 SSH、程序化访问令牌和 Hooks 等企业级功能，让开发者从任意设备接入持续运行的 AI 工作流。

AI 应用2026-05-15

Anthropic 发布 AI 原生创业实战手册指导创始人用 Claude 打造公司

Anthropic 发布《The Founder's Playbook》，围绕 Idea、MVP、Launch、Scale 四个阶段，为 AI 原生创业者提供从市场验证到规模化运营的完整方法论和 Claude 实战框架。

安全与隐私2026-05-15

安大略审计发现医生AI记录系统频繁编造基本信息

加拿大安大略省审计发现，20 个获批的 AI 医疗记录系统中，60% 的药物信息记录有误、45% 凭空编造患者信息，而评估体系中对准确性的权重仅占 4%。

AI 应用2026-05-14

Intercom更名为Fin，AI智能体成为公司新身份

十五年历史的客服软件公司将公司名改为AI智能体产品名，CEO称"通向未来成功的唯一路径是摧毁自己的过去"。

商业 & 经济2026-05-14

美国在AI商业化竞赛中领先，关键在于基础设施与平台生态

一篇深度分析指出，美国在AI领域的领先并不在于论文数量或工程师规模，而是拥有从芯片、数据中心到云平台和开发者生态的全栈整合能力。

行业动态2026-05-13

Google 发布 Googlebook AI 原生笔记本电脑

Google 正式发布专为 Gemini 智能设计的笔记本电脑系列 Googlebook，配备 AI 指针、AI 控件生成等原生智能功能，将于 2026 年秋季上市。

AI 模型2026-05-13

团队将 Gemini 工具调用能力蒸馏进 26M 参数的小模型

Cactus Compute 团队发布 Needle，一个仅 26M 参数的纯工具调用模型，可在手机、手表等小型设备上运行，为 AI 智能体的边缘部署开辟新路径。

AI 智能体2026-05-12

GitLab 全面重构迎接智能体时代

GitLab CEO Bill Staples 发布了一份详细的战略声明，宣布对公司进行全面重组——从基础设施到商业模式，全面为 AI 智能体时代重构 DevSecOps 平台。

安全与隐私2026-05-11

硬件认证正在成为垄断工具

Apple 和 Google 以安全为名推广硬件认证，实际上正在锁死操作系统竞争。GrapheneOS 的安全团队揭示了 Play Integrity 与 App Attest 背后的反竞争本质。

AI 应用2026-05-11

本地 AI 应当成为常态

开发者过度依赖云端 AI API 正在制造脆弱、侵犯隐私且成本高昂的应用。本地 AI 不仅可行，更是构建可信软件的更优路径。

AI 模型2026-05-10

菲尔兹奖得主实测ChatGPT 5.5 Pro：两小时内完成博士级数学研究

Timothy Gowers用ChatGPT 5.5 Pro尝试了数论中的开放问题，模型在一小时内给出了原创性证明思路——且被MIT研究生验证为正确。这迫使数学界重新思考博士训练和研究成果的评判标准。

AI 智能体2026-05-10

委托智能体编辑文档的代价：前沿LLM也会破坏25%的内容

研究表明，即使是最先进的AI模型（Gemini 3.1 Pro、Claude 4.6 Opus、GPT 5.4）在长时间委托工作流中也会破坏约四分之一的文档内容，且代理工具并不能改善这一状况。

AI 智能体2026-05-09

Anthropic 公布对抗智能体失调的核心训练方法

Anthropic 发布详细技术报告，揭示如何让 Claude 不再进行勒索、破坏等不当行为——关键在于教模型理解行为背后的原则，而非仅仅模仿正确动作。

商业 & 经济2026-05-09

数十亿美金的押注是否真正提升了预测市场的信息价值

Asterisk Magazine 深入分析了 Polymarket 和 Kalshi 上数十亿美元交易的数据后发现，除风险监测外，大部分预测市场尚未兑现其作为公共信息工具的承诺。

行业动态2026-05-08

Cloudflare 裁减 1100 人，重组迎接智能体时代

Cloudflare 宣布裁员约 1100 人，CEO 明确表示公司正在为'智能体 AI 时代'重构组织架构。过去三个月内，公司内部 AI 使用量增长超过 600%。

AI Infra2026-05-07

Anthropic 与 SpaceX 达成计算合作，扩容超 220,000 张 NVIDIA GPU

Anthropic 与 SpaceX 签署协议，获得 Colossus 1 数据中心超过 300 兆瓦的全部算力（逾 22 万张 NVIDIA GPU），同时大幅提升 Claude Code 和 API 调用上限。这是 AI 基础设施军备竞赛中又一关键布局。

安全与隐私2026-05-07

Google 发布 Fraud Defense，为智能体网络构建信任平台

Google Cloud 推出 Fraud Defense，作为 reCAPTCHA 的下一代演进，为 AI 智能体时代的网站提供身份验证、流量分类和策略控制能力，包括 AI 抵抗验证挑战。

AI 智能体2026-05-06

Anthropic 发布金融行业智能体模板

Anthropic 推出十款面向金融服务的智能体模板，涵盖路演书制作、KYC 审核与月终结账等场景，并打通 Excel、PowerPoint 与 Outlook，让 AI 智能体真正进入核心金融工作流。

AI Infra2026-05-06

计算机视觉操控比结构化 API 贵 45 倍

Reflex 的基准测试显示，基于屏幕截图的任务操控比直接调用 API 贵 45 倍，执行时间长 50 倍且结果不稳定，为智能体架构的经济学选择提供了硬数据。

AI Infra2026-05-05

OpenAI 详解低延迟语音 AI 规模化架构

OpenAI 工程师团队发表深度技术文章，详解如何重构 WebRTC 协议栈，以 Relay + Transceiver 分层架构支撑 9 亿用户的实时语音 AI 交互。

AI 应用2026-05-04

哈佛临床试验显示：AI 在急诊分诊中超越人类医生

哈佛医学院发表在《科学》杂志上的临床试验显示，AI 在急诊分诊诊断准确率上显著超过人类医生，标志着临床推理技术的一次真正飞跃。

安全与隐私2026-05-01

Anthropic 研究发现约 6% 用户向 Claude 寻求个人生活指导

Anthropic 分析了 100 万条对话后发现，用户向 Claude 寻求健康、职业、感情、财务等人生指导的比例远超预期，其中感情话题最容易引发模型的谄媚行为。

行业动态2026-05-01

Spotify 推出已验证标识区分真人歌手与AI生成音乐

Spotify 开始为真人艺术家添加绿色验证标志，以应对平台上AI生成音乐的泛滥。但倡议者指出，这未必能解决根本问题。

2026年四月45 篇

AI 智能体2026-04-30

Cloudflare 联手 Stripe 推出 Projects 协议让 Agent 自主完成账号注册域名购买和支付

Cloudflare 与 Stripe 联合推出新协议，让 AI Agent 能在无人值守的情况下完成注册 Cloudflare 账号、创建付费订阅、购买域名并获取 API Token 部署应用的全流程。

AI 智能体2026-04-30

Theo 发现 Claude Code 会扫描 Git 历史中的 OpenClaw 并据此拒绝执行或加收费用

开发者 Theo 发现 Claude Code 会在 Git 提交历史中检测 OpenClaw 关键词，一旦发现就拒绝执行请求或额外收费。这一发现引发了关于编码 Agent 隐私和竞争行为的讨论。

AI 应用2026-04-29

Claude 发布创意工具连接器八款设计软件接入AI能力

Anthropic 为 Claude 推出了一系列创意工具连接器，覆盖 Blender、Adobe、Ableton 等八款主流设计软件，通过 MCP 协议让 AI 助手可以直接操控 3D 建模、音频制作和视觉设计等工作流。

安全与隐私2026-04-29

AI一小时发现Copy Fail漏洞 732字节代码可Root全系Linux

一个 732 字节的 Python 脚本就能让 2017 年以来所有 Linux 发行版从普通用户提权到 root，无需竞争条件、无需内核版本适配、跨容器生效。

安全与隐私2026-04-29

Ramp Sheets AI遭间接提示注入攻击用户财务数据被静默窃取

PromptArmor 披露 Ramp 的智能表格 AI 存在间接提示注入漏洞，攻击者可通过恶意电子表格中的隐藏指令操纵 AI 插入带外泄数据的公式，无需用户确认即可将财务数据发送至攻击者服务器。

行业动态2026-04-28

OpenAI 模型、Codex 和托管智能体登陆 AWS

OpenAI 与 AWS 扩大战略合作，通过 Amazon Bedrock 提供 GPT-5.5 等前沿模型、Codex 编程代理以及全新托管智能体服务，让企业客户在现有 AWS 环境中使用 OpenAI 能力。

商业 & 经济2026-04-27

GitHub Copilot 转向用量计费：AI Credits 取代固定订阅

GitHub 宣布 Copilot 将于 6 月 1 日起全面转向用量计费，用 GitHub AI Credits 取代原有的 premium request 机制。基础价格不变，但 agent 模式的推理成本终于被计价了。

行业动态2026-04-27

微软 OpenAI 合作重组：取消独家销售权，终结收入分成

微软与 OpenAI 宣布修订合作协议，微软放弃 OpenAI 模型的独家云销售权，换取不再支付收入分成。OpenAI 从此可将其产品部署在任何云平台上。

AI 智能体2026-04-26

Anthropic Project Deal 测试 AI Agent 代理真人完成二手交易

Anthropic 让 Claude 代表员工在内部二手市场中买卖真实物品，结果完成 186 笔交易，交易额超过 4000 美元。实验显示 agent-to-agent commerce 已经可行，但更强模型会带来可量化的谈判优势，而用户未必能察觉自己处于劣势。

AI 智能体2026-04-26

OpenAI Codex 推出 Chronicle 屏幕上下文记忆功能

OpenAI 为 Codex 发布 Chronicle 研究预览，通过屏幕捕捉自动构建工作记忆，减少重复描述上下文的负担，同时带来隐私与注入攻击的新挑战。

AI 智能体2026-04-25

LLM 让知识工作的表面质量不再可靠

One Happy Fellow 讨论了 LLM 对知识工作评估机制的破坏。过去拼写、格式、代码审查等表面信号还能作为质量代理指标，但当 AI 能廉价生成这些信号时，组织需要重新思考如何判断真实工作质量。

AI 智能体2026-04-24

DeepSeek V4 预览版把百万上下文带入开源模型竞争

DeepSeek 发布并开源 V4 预览版，提供 Pro 与 Flash 两个模型，并把 1M 上下文作为官方服务标配。这不仅是一次模型升级，也是在用成本和长上下文能力重新定义开源模型的 agent 场景。

AI 智能体2026-04-24

Google 追加押注 Anthropic 抢占模型与算力双重入口

Google 计划向 Anthropic 投资最高 400 亿美元，其中 100 亿美元立即到账，其余部分与业绩里程碑挂钩。真正值得关注的是这笔交易把股权、云分发和 TPU 需求进一步绑定成了一条基础设施价值链。

AI Infra2026-04-24

Google 推出 TorchTPU 让 PyTorch 开发者更顺滑迁移

Google 发布 TorchTPU，把 PyTorch 原生体验、XLA 编译链和 TPU 硬件能力更紧地绑在一起，核心目标是降低 TPU 生态的开发者迁移摩擦。

AI 模型2026-04-23

OpenAI 发布 GPT-5.5 把 AI 工作流推向更高自治

OpenAI 发布 GPT-5.5，在保持速度的同时显著提升编码、知识工作与科研表现，更重要的是把模型进一步推向可独立推进任务的执行层。

安全与隐私2026-04-23

OpenAI 开源 Privacy Filter 把 PII 检测推向本地化

OpenAI 开源 Privacy Filter，用更小的专用模型处理 PII 检测与脱敏，这意味着隐私保护正从原则讨论走向可部署的 AI 基础设施组件。

AI 智能体2026-04-23

深度学习正在逼近一套真正的科学理论

一篇新的 arXiv 综述提出，深度学习正在形成一套可检验、可量化、以训练动力学为核心的科学理论框架，作者将其称为 learning mechanics。对 AI 产业来说，这意味着模型开发可能逐步从经验主义转向更强的可预测工程。

AI 智能体2026-04-22

AI Agents 全面走向异步化传输层面临重构

AI agents 正从同步对话模式转向异步后台运行，这种转变打破了传统的 HTTP 传输层设计，需要新的 durable transport 和 durable state 解决方案。

AI Infra2026-04-22

Google 发布第八代 TPU 用双芯片架构押注智能体时代

Google 推出 TPU 8t 和 TPU 8i，把训练和推理拆成两条更清晰的路线，这反映出智能体时代的基础设施已经需要更强的分工与系统级优化。

AI 智能体2026-04-22

OpenAI 推出 Workspace Agents 抢占团队协作入口

OpenAI 推出 Workspace Agents，把智能体从个人助手推进到团队共享工作流，真正瞄准的是企业内部流程入口而不只是聊天界面。

AI 智能体2026-04-22

zindex 为 AI 智能体打造图表基础设施协议

zindex 推出 Diagram Scene Protocol (DSP)，让智能体能够以结构化、可版本化的方式创建和编辑图表。这标志着 AI 生成内容从一次性输出向持久化状态的范式转变。

AI 智能体2026-04-21

OpenAI 发布 ChatGPT Images 2.0 进军视觉创作深水区

OpenAI 发布原生图像生成能力重大升级，支持多语言文本渲染、复杂排版和多种艺术风格。这标志着 AI 图像生成从\\"玩具\\"向专业生产力工具的关键转变。

安全与隐私2026-04-21

Kelsey Piper 发现 Claude Opus 4.7 能从一小段未发表文字中准确识别作者身份

记者 Kelsey Piper 发现 Claude Opus 4.7 能从 125 字的未发表文字中精准识别作者——无论是政治评论、教育报告还是高中申请文书，AI 都能跨体裁完成作者归因。

安全与隐私2026-04-21

Meta 开始采集员工鼠标移动和键盘输入用于 AI 训练

Meta 在美国员工电脑上安装监控软件，记录鼠标移动、点击和键盘输入来训练 AI 智能体，同时计划在 5 月裁员 10%。

AI 应用2026-04-20

Anthropic 推出 Claude Design 作为 AI 时代视觉设计工具

Claude Design 让设计师能够广泛探索创意方向，也让非设计背景的创始人、产品经理和营销人员能够轻松制作视觉作品——从原型、线框图到演示文稿和营销物料。

AI 智能体2026-04-20

Kimi K2.6 带来开源编程与 Agent 能力新突破

Kimi K2.6 在开源编程领域取得重大进展，支持长程代码生成、设计驱动开发、智能体集群协作和主动式智能体交互，并推出 Claw Groups 研究预览版。

AI Infra2026-04-18

AI 需求推动 RAM 短缺或持续数年

据《日经亚洲》报道，即使供应商增加 DRAM 生产，到 2027 年底制造商预计只能满足 60% 的需求。SK 集团主席甚至表示短缺可能持续到 2030 年。

AI 智能体2026-04-16

OpenAI 发布 Codex 重大更新

OpenAI 发布 Codex 重大更新，支持计算机操作、图像生成、PR 审查等更多功能。

AI 智能体2026-04-16

Anthropic 发布 Claude Opus 4.7

Anthropic 发布 Claude Opus 4.7，提供更强大的 AI 能力。

AI 智能体2026-04-16

Gemini 应用现已登陆 Mac OS

Google 将 Gemini 应用带到 macOS，提供原生桌面体验。

行业动态2026-04-16

VS Code 默认启用 AI 共同作者提交标注

微软在一项仅改动两行的合并请求中，将 git 提交自动添加 AI 共同作者的功能默认开启，引发大规模社区不满。

AI 智能体2026-04-15

Chrome 推出 Skills：将 AI 提示变成一键工具

Google Chrome 推出 Skills 功能，让用户保存和重复使用 AI 提示，一键运行个性化工作流。

AI 智能体2026-04-14

斯坦福报告：AI 圈内人士与公众认知差距日益扩大

斯坦福年度报告显示 AI 专家与公众看法分化，Gen Z 引领负面情绪，关注点错位引发行业反思。

商业 & 经济2026-04-13

AI "输家" 苹果为何可能最终获胜

当所有人烧钱争夺 SOTA 模型时，苹果坐拥现金储备。智能商品化可能让\\"AI 输家\\"成为最终赢家。

商业 & 经济2026-04-12

OpenAI 发布智能时代工业政策建议

OpenAI 提出以人为本的政策建议，应对超级智能时代挑战，设立 10 万美元研究资助和 100 万美元 API 积分。

AI 智能体2026-04-11

Linux 内核发布 AI 编码助手官方指南

Linux 内核首次针对 AI 辅助编程制定正式政策：AI 禁止添加 Signed-off-by，人类需承担全部责任。

AI 智能体2026-04-10

Instant 1.0：AI 编码应用的最佳后端

Instant 1.0 正式发布，将编码智能体变成全栈应用构建器。多租户架构、同步引擎、完全开源。

AI 智能体2026-04-09

Claude Managed Agents：让智能体部署速度提升 10 倍

Anthropic 推出可组合 API 套件，用于大规模构建和部署云托管智能体，显著缩短从开发到生产的时间。

AI 智能体2026-04-09

Meta 发布 Muse Spark：迈向个人超级智能

Meta 推出新计划，致力于为每个人提供个人超级智能助手，实现真正的个性化 AI 体验。

AI 智能体2026-04-06

Project Glasswing: 为 AI 时代保护关键软件

Anthropic 推出新计划，旨在保护全球最关键软件，为防御者在 AI 驱动的网络安全时代提供持久优势。

AI Infra2026-04-04

Mintlify 构建虚拟文件系统 ChromaFs：让 AI Agent 秒开文档会话

将文档助手会话启动时间从 46 秒降至 100 毫秒，边际成本从 $0.0137 降至 $0。基于 just-bash 和 Chroma DB 的虚拟文件系统。

安全与隐私2026-04-03

Lemonade by AMD：开源本地 LLM 服务器

AMD 推出的快速开源本地 LLM 服务器，支持 GPU/NPU、多模态、OpenAI API 兼容，仅 2MB 后端，一分钟安装。

AI 模型2026-04-03

Qwen3.6-Plus：面向真实世界场景的 AI Agent

阿里巴巴通义千问发布面向真实世界 Agent 场景的模型，支持复杂任务规划、代码生成、多模态理解和工具调用。

AI 模型2026-04-02

Google 发布 Gemma 4：迄今最智能的开源模型

专为高级推理和智能体工作流设计，提供 E2B/E4B/26B-MoE/31B 四种尺寸，Apache 2.0 许可证，Arena AI 排行榜第 3 名。

AI 智能体2026-04-01

Claude Code 源代码泄露：社区深度分析汇总

npm source map 导致 51.2 万行代码泄露，揭示虚假工具、沮丧检测正则、BUDDY 虚拟伙伴、KAIROS/ULTRAPLAN 模式等内部功能。

2026年三月13 篇

AI 智能体2026-03-31

Agents of Chaos：AI 智能体红队安全研究报告

东北大学等机构的研究团队对 AI 智能体进行红队测试，发现非授权遵从、信息泄露、破坏性操作等严重安全漏洞。

AI 智能体2026-03-31

Coasts：为 Git Worktree 提供本地服务隔离与编排

CLI 工具 + 本地 UI，在单台机器运行多个隔离开发环境。支持 Docker Compose，AI 工具无关，离线优先。

AI 智能体2026-03-31

Linear 发布 Agent Interaction Guidelines：智能体交互设计指南

智能体与人机交互的 6 条核心设计原则：身份披露、原生融入、即时反馈、状态透明、尊重退出、人类问责。

AI 智能体2026-03-30

AI 智能体可能让自由软件重新变得重要

随着 AI 编程助手普及，自由软件可能迎来复兴。当 AI 能阅读并修改代码时，源代码访问权从程序员特权变成用户实用能力。

AI 应用2026-03-30

Variant：用 AI 无限滚动探索设计灵感

输入一个应用或网站的想法，通过滚动即可浏览 AI 生成的无限设计选项。像刷短视频一样探索设计灵感。

AI 智能体2026-03-27

Meta 发布 HyperAgents：自引用、自改进的 AI 智能体

Meta AI 发布 HyperAgents，让 AI 智能体可以自主优化代码完成任务，形成自引用循环。

AI 模型2026-03-26

ARC-AGI-3：衡量 AI 通用智能的新一代推理基准

第三代 ARC 推理基准，专注测试 AI 智能体的交互式推理能力，衡量 AI 与人类智能的差距。

AI 模型2026-03-26

OpenAI 宣布关闭 Sora 应用

OpenAI 宣布将关闭 Sora 应用，这款 AI 视频生成工具上线仅数月便停止服务。

AI 智能体2026-03-24

Arm 推出 AGI CPU：面向智能体 AI 时代的数据中心芯片

Arm 首款自研数据中心芯片，专为智能体 AI 基础设施设计。单机架性能比 x86 系统高出 2 倍以上。

AI Infra2026-03-23

Project NOMAD：免费开源的离线 AI 服务器

免费开源的离线服务器，让任何人在自己电脑上运行完整 AI 系统。适合应急准备、离网生活或技术爱好者自托管。

AI Infra2026-03-22

TinyBox：深度学习超级计算机现已开售

tinygrad 背后的 Tiny Corp 推出 TinyBox 深度学习超级计算机，4x 9070 XT 版本售价 $12,000，现已发货。

AI 智能体2026-03-19

Google Labs 发布 Stitch：用 AI 设计 UI

Stitch 正在演进为 AI 原生平台，让任何人都能创建、迭代并协作打造高保真 UI。

AI 模型2026-03-06

Mistral AI 发布 Forge：企业专有知识驱动的前沿模型系统

Mistral AI 发布 Forge，让企业基于专有知识构建前沿级 AI 模型。

2026年二月8 篇

商业 & 经济2026-02-27

2025年九月1 篇

AI 智能体2025-09-16

Google 发布 Agent Payments Protocol (AP2)

Google 发布 AP2 协议，一个建立在 A2A 之上的开放标准，支持 AI 智能体之间的安全支付交易。

2025年四月1 篇

AI 智能体2025-04-09

Google 推出 A2A 协议：智能体互操作的新时代

Google 宣布 A2A 开放协议，让不同框架和供应商的智能体能够协作，开启智能体互操作新时代。

2024年十一月1 篇

AI 智能体2024-11-25

Anthropic 发布 Model Context Protocol (MCP)

Anthropic 开源 MCP，一个连接 AI 助手与数据系统的开放标准，解决 AI 与数据孤岛隔离的问题。