上周末我发现自己的文章被AI逐段复述了,那一刻我愣住了。
我辛苦写了三天的行业拆解,被某个聊天工具"总结"出来,连我编的案例都没换。我第一反应是愤怒,第二反应是——这事儿我能怎么办?这步我也卡过,觉得自己是小博主,大公司不会注意到我。但这次Meta的官司让我意识到:他们不是"注意到你",是批量扫,你的内容在我这份里,也在他们的训练数据里。
发生了什么:Zuckerberg亲自授权用别人的版权内容训练AI
多家出版商起诉Meta,文件显示Zuckerberg亲自批准了使用受版权保护的内容来训练Llama模型。简单说就是:大公司高层拍板,把别人写的东西拿来自家AI学习,没打招呼也没付钱。张薇,杭州的自由撰稿人,上个月在西湖区星巴克用手机搜自己的付费专栏,发现某AI工具几乎逐段复述了她的观点。她截图发给我说"感觉被偷了却不知道该找谁"。我完全理解那种无力感——咱们一个人,怎么跟千亿公司打?但至少有些事今天就能做。
你今天能做的:花0块钱、10分钟,减少被爬走的内容
复刻成本:钱0元 + 时间10分钟 + 技术门槛:会登录网站后台就行。第一步:如果你用WordPress,搜索插件"Block AI Crawlers",点"安装并激活",它会在你网站的robots.txt(就是告诉爬虫"哪些页面不许碰"的配置文件)里自动加上禁止主流AI爬虫的规则。如果你不用WordPress,手动在robots.txt里加两行:User-agent: GPTBot 和 Disallow: / ,同理再加CCBot和Google-Extended。这不是万能的——守规矩的爬虫会遵守,不守的照样来——但至少多了一层保护。这工具不是所有人都需要,现在不试也没事,你的内容不会明天就消失。
分人群建议
如果你刚起步、还没太多原创内容:先专注把东西写出来,robots.txt花2分钟加一下就行,别焦虑版权问题,你更大的挑战是被看见。
如果你有1-2个客户、开始有付费内容了:我建议你认真加上爬虫屏蔽,同时在自己文章底部加一行版权声明。这是你的资产,该有的标记要有。
如果你在扩规模、已经有稳定的内容产出:考虑注册"DMCA投诉"服务(约每年100美元),定期用Google搜自己的原创段落看是否被搬运。你的内容库越大,被系统性收割的概率越高,值得花这点钱保护。