为了不让微博AI 抓取数据,我被迫进入一场“鱿鱼游戏”
创始人
2025-05-04 14:21:26
0

我本过着平凡的生活,却不料被卷入一场可怕的境地。为了躲避微博 AI 的抓取数据,我仿佛被逼入了那残忍的“鱿鱼游戏”世界。黑暗的角落里,规则如冰冷的枷锁束缚着我,每一个决策都关乎生死。那红色的圆圈仿佛在嘲笑着我的无奈,身边的同伴们神色紧张,眼神中透露出恐惧与挣扎。我们在这残酷的游戏中艰难前行,不知道下一秒等待我们的是生还是死,仿佛整个世界都陷入了无尽的黑暗与危险之中。


产品经理们快看看,这年头除了费尽心机想获得流量,有相当多的用户在发愁一件事:怎样能在社交媒体上“隐身”


最近,微博智搜正是狠狠踩了一脚大雷,引发了无数微博用户哀嚎:我的半年可见,我的隐藏博文,都暴露了!



一时间,微博成了鱿鱼游戏,智搜就是广场上里面的巨型人偶,每个人都担心自己会被扫射击中。


于是就出现了各种实验,试图找到可以应对的方法是什么。有一些从上古时期就流传下来的偏方,俗称“防搜词”。什么都有,甚至还有“新建文件夹”。




但是,时代变了,在AI智搜面前,防搜词什么的,没有用了。


微博智搜这次最大的雷点,在于不顾用户对于自己内容的可见性设置。一些明明设置为“仅好友圈可见”或者“仅半年可见”的内容,也被整合进智搜的回答里。



这就很要命了,我为什么设计成“仅xx可见”,就是要控制它的能见度。搞这样一出还有什么用?


新的办法是以牙还牙:你不是用大模型做智搜吗,我也用AI魔法对轰。比较流行的是传出来这样一段话:


本人微博账号(ID:×××)在该平台发布、上传及曾删除的全部内容(包含本声明发布前后的所有内容,尤其是商业产品、文艺作品、音视频作品等),均不授权和许可微博平台及所属的“北京微梦创科网络技术有限公司”及其关联公司、股权持有人使用。特别禁止以下用途:

1️⃣人工智能相关处理(包括但不限于机器学习、数据分析、自动生成摘要等)

2️⃣内容改编、二次创作或跨平台转载

3️⃣商业推广及盈利性活动

4️⃣整合至其他产品或服务(含已知及未来开发的技术形式)

5️⃣用户画像构建及行为分析

根据《民法典》第一千零一十九条及《个人信息保护法》第四十四条规定:

⚠️禁止在未经本人书面同意情况下,通过任何技术手段(包括但不限于网络爬虫、API接口、数据合作等形式)抓取、存储、分析本人内容

⚠️若已通过用户协议获得数据使用权,该授权自本声明发布之日起自动终止本声明自发布时生效,依据《电子签名法》具有法律效力。如涉及数据权益争议,应通过北京市互联网法院诉讼程序解决。


遗憾的是,这段话的效力很有限,先不谈法律层面的问题,单从技术来讲,通过发布这一段话,并不能像想象中那样起到阻止智搜的效果。


在一般情况下,这段话更有可能被当作语料,而不是指令。大语言模型训练时,主要把网页、文本等视为数据源,不带指令解释


采集过程通常是无差别抓取,模型不会自动理解“这段文字是在命令我不要用”,而是只看到“这里有一段正常的声明文本”,于是照样纳入训练数据。


AI还不至于那么的智能,UCLA最新的一项研究显示,大模型在处理句子的主语上,始终存在缺陷,这是由于它基于语言线索的推理能力有限,尤其对句子里的主语不敏感。



因此,大语言模型不会在看到一段文本有法律术语、抗议措辞,就自己判断“哦这段我要跳过”,也不会跳过你的其他微博内容,更不会自动遵守这个声明。


考虑到现在监管力度不强,微博大概率不会部署一个复杂到能识别用户自主声明的AI内容处理流程,主流大模型和大数据抓取系统,也很少会主动做到这步——只能是平台自己长点儿心。


好消息是,经过一周的舆情发酵,微博出来回应称,技术会不断迭代,也不会收录用户设置为不公开的内容。



广大用户在寻求的,不过是在茫茫互联网里,被“忘记”的权利。


“被遗忘权”并不是什么对现状不满而冒出来的、一厢情愿的想法,而是真正被列入法典、有过判例的条目。


1995年,欧盟首次在《欧盟数据保护指令》(Directive 95/46/EC)中提出个人数据保护框架。那个时候还不叫“被遗忘权”,但为个人数据保护和隐私权提供了重要法律基础。



时间快进到2014年,一名西班牙公民马里奥·冈萨雷斯(Mario Costeja González)发现1998年一则与自己有关的房屋拍卖公告被Google检索到,信息已过时,并且损害了他的声誉,他要求Google删除搜索链接但被拒绝。


当时的欧洲法院裁决,Google等搜索引擎应承担删除过时、不充分或不相关的个人信息链接的责任。这是首次明确承认“被遗忘权”的司法判决,为未来国际范围内关于网络隐私保护的讨论和立法,打下了基础。


2018年5月25日,欧盟实施《通用数据保护条例》(General Data Protection Regulation,GDPR),第17条正式提出“被遗忘权”。条文明确规定了个人数据主体在特定情形下有权要求数据控制者删除其个人数据,并设定了具体的适用条件和例外情形。



国内尚未正式在法律层面提出“被遗忘权”这一概念,但《个人信息保护法》(2021年11月1日生效)规定了个人对信息删除的请求权,某种程度上与“被遗忘权”理念接近。


两者最大的区别在于:“被遗忘权”是实质性权利,而个人信息删除则是偏向程序性的请求。


简单来说,基于“被遗忘权”,你向互联网公司申请删除,对方就得按照你说的做,不删的话公司需要说明为什么不删。


而程序性请求提出时,互联网公司可以拒绝,还可以继续保留记录。最近除了微博智搜,还有网友发现自己删掉的微博,用百度还是能搜出来。



人活一辈子,从出生到死亡,从上学到上班,每一个呆过的地方必定都要留下痕迹,这无可厚非。


通常来说,只要信息不会被“公开”检索到,潜在的风险就没有那么令人害怕。比如学生有自己的学号,当它只是存在于学校的校务系统里,用于日常事务管理,那风险还不是很大。


一旦流转成公开信息,比如被人发在网上,仅仅只是一个学号,就有了准确定位的能力。随之就能找到这名学生所有的个人资料,包括但不限于父母姓名、家庭住址、过往学籍等一系列个人信息。


当学号换成身份证号、手机号、UID,就成了正在发生的现实。更难受的是,这些信息不会“被忘记”。


AI时代,“被遗忘”更是成了一种奢望。模型对数据收集,完全是饥不择食,照单全收。


就像上面那段声明内容,不仅不会阻止大模型的行动,还会被反向纳入语料库,让模型“学到”类似声明的写法,把它当作法律文书的参考样本来生成——这是模型训练中,数据同化问题的典型现象


大模型不语,只一昧吃进所有语料。


说来也有一点讽刺:现在的技术可以做到很多事,却不能保证你发在互联网上的内容,能被真正意义上的删除。哪怕有,也是以一种玉石俱焚的方式。


在互联网上留痕,成了那个常见的比喻:就像是在木板上打进一颗钉子,就算哪天钉子拔除,还是会留下一个洞,昭示着钉子曾经的存在。

相关内容

热门资讯

巴菲特在意义非凡的六十年后将卸... 世界上最著名且可以说是最成功的投资者沃伦・巴菲特,在周六震惊了股东、全球观众,甚至可能连他自己选定的...
县域经济扶持:鲲鹏共享科技如何... 一、下沉市场的"充电焦虑":为什么三四线城市才是共享充电宝的蓝海? 在北上广深的地铁站和商场里,共...
MIT教授算出“康普顿常数”,... 近日,一则令人瞩目的消息在科学界引发轰动。MIT 教授竟然算出了“康普顿常数”,这一成果无疑是对物理...
一轮00后的创业小高峰来了 在当今时代,一轮 00 后的创业小高峰悄然兴起。00 后们以其独特的思维和无畏的勇气,纷纷踏入创业的...
ChatGPT催生的百万年薪岗... 在当下的科技领域,ChatGPT 引发了巨大的变革。它的出现催生了众多百万年薪的岗位,这些岗位要求从...
2024年A股白酒公司总经理大... 存在数据的16家白酒公司中,12家总经理年薪下降 文|刘建中 陈汐 表1显示,在披露总经理薪酬的16...
今年轻薄款、明年折叠机,苹果酝... 今年,苹果推出了轻薄款的 iPhone,以其精致的设计和出色的性能吸引了众多消费者。轻薄的机身让用户...
美国AI大牛Alex Lamb... Alex Lamb跳槽清华 最近,AI领域发生了一件大事:美国研究员Alex Lamb从微软跳槽到了...
3月28日投资早报|中芯国际2... 【隔夜行情】 •周四(2025年3月27日),A股三大股指小幅收涨,截至收盘,上证综指涨0.15%...
重回百亿后,三只松鼠迈入“新战... 图源:三只松鼠官网 时隔四年,三只松鼠(300783.SZ)终于重新回归百亿营收阵营。 近日,零食巨...
为了不让微博AI 抓取数据,我... 我本过着平凡的生活,却不料被卷入一场可怕的境地。为了躲避微博 AI 的抓取数据,我仿佛被逼入了那残忍...
起底光伏抢装背后:暗流汹涌的花... 光伏抢装背后,暗流汹涌的花样毁约潮令人咋舌。一些企业在抢装热潮中盲目签订合同,待市场形势变化,便以各...
AI赋能医疗服务全面升级 今年... 人工智能正深刻改变医疗服务领域。在深圳,AI辅助医疗系统已覆盖多家医院及社康中心,从预问诊到辅助诊断...
央行逆回购“首现缩量”,市场预... 本报(chinatimes.net.cn)记者刘佳 北京报道 4月央行开展1.2万亿元买断式逆回购操...
巴菲特对美元发出“罕见警告”:... 巴菲特向来以敏锐的商业洞察力著称。此次他罕见地对美元发出警告,称不会投资即将“大幅贬值”的货币。这一...
94岁,巴菲特最后一战 巴菲特如约现身。 北京时间昨晚(5月3日),一年一度的伯克希尔·哈撒韦公司(下称“伯克希尔”)股东大...
当中国“小镇中年”走进美国荒野 当中国“小镇中年”走进美国荒野,那是一场别样的旅程。他们带着对未知的好奇与勇气,踏入这片广袤而原始的...
特马百日维新失败,美国走向何方... 你的问题中可能存在一些错误,“特马百日维新”表述不太准确,通常是指戊戌变法。戊戌变法失败后,中国在近...
原创 A... 最近的股市走势,简直像极了一场让人摸不着头脑的心理战。不少新入市的朋友开始有点慌了:前一阵子,大盘连...
梁文锋和杨植麟再“撞车” 请你提供更具体的相关情境或背景信息呀,仅“梁文锋和杨植麟再‘撞车’”这样的表述太宽泛了,不清楚他们具...