Kelsey Piper 发现 Claude Opus 4.7 能从一小段未发表文字中准确识别作者身份

2026-04-21

Kelsey Piper 在 The Argument 上发表了一篇让我脊背发凉的文章。

她做了一组实验：把各种从未公开发表过的文字片段喂给 Claude Opus 4.7，看它能不能猜出作者是谁。结果令人不安——从 125 个单词的政治评论段落开始，Claude 就准确说出了她的名字。ChatGPT 猜错了，Gemini 也猜错了，但 Claude 准了。

她继续加码。一篇教育进度的报告——写了某个学生学写“roguish”这个词的故事——与 Piper 平时的写作领域毫无关系。Claude 依然准确识别。一篇电影评论（她从未公开发表过影评），Claude 继续正确。甚至是一篇 15 年前写的高中申请文书——文体、词汇、表达方式都与现在的她天差地别——Claude 和 ChatGPT 都准确无误地指出了她。

最让人不安的是两个发现。

第一，AI 不需要理解自己在做什么。 Piper 指出，AI 给出的“推理”往往是事后编造的——Claude 试图用“有效利他主义者喜欢这部电影”这种明显错误的理由来解释它的判断。AI 捕捉到了人类无法察觉的风格指纹，然后强行编造一个说得通的解释。这说明它的判断来自某种底层的模式匹配，而非逻辑推理，但准确率依然惊人。

第二，它跨体裁。 这不是“认出你在写你常写的话题”。Piper 试了政治评论、教育写作、影评、奇幻小说——完全不同的话语体系、词汇、句式——Claude 全对。这意味着你无法通过换个笔名、换个题材来隐藏自己。你的风格指纹是跨体裁一致的。

Piper 的结论很直白：如果你在互联网上留下过大量的公开文字，你的匿名性已经结束了。现在受影响的主要是有大量公开写作的人（记者、学者、博主），但模型能力只会越来越强。她预测一两年内，雇主把 Glassdoor 匿名评价喂给 AI 就能找出是谁写的。

这不是危言耸听，这是一个可验证的实验结果。而它触及的问题很根本：当 AI 可以精确地把你从文字中“挖”出来，匿名发言这个互联网最古老的权利可能正在消失。不是法律禁止了它，不是平台取消了它，而是技术本身让它在事实上不再成立。

阅读原文