Kelsey Piper 发现 Claude Opus 4.7 能从一小段未发表文字中准确识别作者身份
Kelsey Piper 在 The Argument 上发表了一篇让我脊背发凉的文章。
她做了一组实验:把各种从未公开发表过的文字片段喂给 Claude Opus 4.7,看它能不能猜出作者是谁。结果令人不安——从 125 个单词的政治评论段落开始,Claude 就准确说出了她的名字。ChatGPT 猜错了,Gemini 也猜错了,但 Claude 准了。
她继续加码。一篇教育进度的报告——写了某个学生学写”roguish”这个词的故事——与 Piper 平时的写作领域毫无关系。Claude 依然准确识别。一篇电影评论(她从未公开发表过影评),Claude 继续正确。甚至是一篇 15 年前写的高中申请文书——文体、词汇、表达方式都与现在的她天差地别——Claude 和 ChatGPT 都准确无误地指出了她。
最让人不安的是两个发现。
第一,AI 不需要理解自己在做什么。 Piper 指出,AI 给出的”推理”往往是事后编造的——Claude 试图用”有效利他主义者喜欢这部电影”这种明显错误的理由来解释它的判断。AI 捕捉到了人类无法察觉的风格指纹,然后强行编造一个说得通的解释。这说明它的判断来自某种底层的模式匹配,而非逻辑推理,但准确率依然惊人。
第二,它跨体裁。 这不是”认出你在写你常写的话题”。Piper 试了政治评论、教育写作、影评、奇幻小说——完全不同的话语体系、词汇、句式——Claude 全对。这意味着你无法通过换个笔名、换个题材来隐藏自己。你的风格指纹是跨体裁一致的。
Piper 的结论很直白:如果你在互联网上留下过大量的公开文字,你的匿名性已经结束了。现在受影响的主要是有大量公开写作的人(记者、学者、博主),但模型能力只会越来越强。她预测一两年内,雇主把 Glassdoor 匿名评价喂给 AI 就能找出是谁写的。
这不是危言耸听,这是一个可验证的实验结果。而它触及的问题很根本:当 AI 可以精确地把你从文字中”挖”出来,匿名发言这个互联网最古老的权利可能正在消失。不是法律禁止了它,不是平台取消了它,而是技术本身让它在事实上不再成立。