V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
necomancer
V2EX  ›  程序员

关于隐私,有个奇怪的想法

  •  2
     
  •   necomancer · 2021-01-20 02:02:08 +08:00 · 3633 次点击
    这是一个创建于 1186 天前的主题,其中的信息可能已经有所发展或是发生改变。

    这两天到处都是腾讯扫描数据的消息。虽然腾讯宣称并没有泄露数据,但是根据一些网友分析,称腾讯会扫描一些带特定关键词的数据,例如淘宝,京东,股票和金融。原始数据也许没有泄露,但是有没有可能腾讯会离线分析和汇总数据以后再拿走结果?这方面我不是专业人士,也没有在网上看到关于 QQ 分析数据的代码……不过关于数据安全,我倒有一个奇怪的想法,有没有什么可以集成在浏览器上的插件比如会模拟随机在淘宝搜东西(我知道淘宝联想推送,但是实话说这个功能我并不想要)或者模拟随机点各类新闻,或者关键隐私数据部分生成一些虚假信息,让自己的隐私信息淹没在垃圾信息里?其实从 10 年前开始,国产软件耍流氓的新闻就层出不穷,一概虚拟机 /沙盒也不是万能解决方案,所以面对无法反抗的现状,能不能从数据分析一块入手?让自己的隐私数据完全无规化、无价值?

    第 1 条附言  ·  2021-01-20 03:50:29 +08:00
    @sasalemma 说得对,做普通人,用共享账号。

    我可能没能完全说明我想法的来源,产生这种用混淆数据想法的来源主要有两个,一是大数据杀熟;二是,我以 X 宝,X 呗和 X 付宝来说吧,二三十年前,信用卡总和各种推销结合在一起,用户通过申请的填表告诉银行自己的收入,银行根据账单和还款来判定用户花钱的尿性。然后推销员总能在合适的时间推销合适的商品,以及一个看着很诱人的分期计划。于是,用户开心地进入劳动-消费-还利息的循环,无暇顾及其他,只需要定期地用新商品进行刺激。而银行则把用户变成矩阵里可爱的小电池,开始用债券玩儿钱生钱的游戏,哪怕用户自己都知道银行用债券赚得比自己借的还多。于是皆大欢喜。时至今日,我们可爱的小应用就可以知道用户盯着什么东西看了多长时间,这个东西价位、属于什么分类以及用户的购物账单、X 呗账单,甚至信用卡账单,现在甚至不需要将数据汇总,应用告诉用户:您的隐私无价呢亲~我们不收集呢亲~因为客户端就能完成分析并开始进行推销员的工作,接着在付款按钮旁边加上诱人的 x3,x6,x9 和 x12 。通过这些成为小电池的用户绝不是个案,X 蚁金服这几年爆炸式的发展应该是证明了电池人批量产生的统计意义。另一个侧面证明就是 X 佳奇只用了 3 年就买下了 1.3 亿的豪宅,我可不信他之后是靠贷款缴物业费。仅三年,这也算从侧面证明了广大人群成为可爱的小电池的潜力,非常具有统计意义。玩债权的人与二三十年前相比,可以说是武装到了牙齿,把成本压缩到了最低,还最大限度地提高了受众,在街头做信用卡推销毕竟也是辛苦的工作呢,开通 X 呗需要什么?而对于用户群体呢?应对方案却和二三十年前一样:在床头摆一副“壁立千仞无欲则刚”,勤俭持家,合理投资——这些人应该属于小众吧。这也是我产生这个想法的初衷,靠自觉这种事,早在互联网不普及的年代就证明刚不过推销员甜蜜蜜地小嘴了,所以,我在想,能不能也用同样的工具进行应对?如果大量用户的数据变成垃圾,我想电池人应该少产生很多吧。

    P.S. 我是很想把这个贴子放在“赛博朋克”话题里的,但是看到那边都在认真地讨论游戏,就放在“程序员”下了。
    16 条回复    2021-01-20 16:12:28 +08:00
    sasalemma
        1
    sasalemma  
       2021-01-20 02:23:30 +08:00
    喵喵喵?当年 hips 盛行的时代,360 还没有收编 md 的时代,comodo 还是 5.1x 的时代,不早就是企鹅搜索全盘的状况,现在又水深火热,感觉这才是真企鹅。

    通信软件端到端加密就是双刃剑,毕竟发送了什么,你不知我不知。

    另 bug10 都光明正大搜集这些了,还能说什么,比如 v10.events.data.microsoft.com



    个人看法,从社会工程学和统计学来说,任何个体的特征行为实际上没有什么意义,有意义的训练样本都是相互之间的关系,所以,支付宝,狗东,和本来就玩设交的腾讯,才会让你填上子女,父母,亲密付的信息。反过来说,要使数据无意义,就做一个普通人,普通人,芸芸众生。

    淘宝推什么就点什么,热搜什么就点什么,让它在认识你的路上越来越远。

    话说回来,实际上真正的隐私问题,是半真实半虚拟才有,比如你的微信。本来像以前 qq,没有实名,没有手机,就是虚拟的,换个 qq 号就行了,而当虚拟的号码绑在一个实体上才有隐私问题。

    如果你的朋友用着你的淘宝,你用着朋友的淘宝,那你买什么,送货到朋友的手机,对于淘宝来说,也是把你朋友这个号和你的实体关联而已,但人家要的也不是你实体的隐私,而已关联的隐私就够了,你用什么号不重要,只要你用了,这个号的这个实体,就是这个兴趣爱好,除非你不用啊。

    所以说白了用一个 app 这么辛苦,要混淆,还不如,叫你朋友帮你买东西就算了,或者一家人用一个账号。
    kaiki
        2
    kaiki  
       2021-01-20 04:09:21 +08:00
    我连生活中都只说一半真话,那些数据怎么可能提供真的呢。
    不过大数据有可能会筛选你资料中可信的部分来给你画像,一味地塞垃圾数据很有可能会被系统轻易筛掉。
    necomancer
        3
    necomancer  
    OP
       2021-01-20 04:11:38 +08:00
    @kaiki 这只是想法,不过我觉得技术也是很有意思的。就像人脸识别和反人脸识别。怎样才能做到有效的混淆~
    lindas
        4
    lindas  
       2021-01-20 05:22:00 +08:00   ❤️ 1
    firefox 有个屏蔽广告的扩展组件叫 AdNauseam,作用除了屏蔽广告外,它还会点击所有广告链接,起到混淆的作用,这个应该算是一种
    xcstream
        5
    xcstream  
       2021-01-20 05:30:30 +08:00
    可以 但没必要
    你不是什么公众人物
    nzynzynzy
        6
    nzynzynzy  
       2021-01-20 06:07:43 +08:00
    一个观察

    背景:肉身翻墙 6 年了,至今携带着国内的十一年在网的手机号,支付宝微信绑定的是海外手机,淘宝(重度使用)、PDD 和 JD (轻度使用)都是给家人买东西或者直接寄到转运公司,QQ 弃用,微博绑定虚拟号码

    现象:
    1. 手机号接到的诈骗电话和广告短信越来越少,刚开始 2 天 1 个,现在 1 个月少于 1 个
    2. 淘宝的推荐主要是之前搜索过的东西,没有跨平台的现象,从来没接到过淘宝商家的短信
    3. 国外的垃圾短信随着在网年龄变长也很泛滥,BTC 的垃圾短信天天都有
    4. 蚂蚁分 760+多,其实我在国内资产并不多,没有信用卡,有的卡都是借记卡而且很 low 的那种,这个算法不明
    5. 花呗 14K,算多算少?反正没提过额,因为我国内没台面上的工资

    在国内的情境下我这种人基本算是隐身了,可以对比你们高度暴露的个人信息。各位有什么需要问、可以作为对比的,随便问
    LimeQAQ
        7
    LimeQAQ  
       2021-01-20 07:29:57 +08:00 via iPhone
    @nzynzynzy 虚拟卡都能绑定些什么账号?
    S179276SP
        8
    S179276SP  
       2021-01-20 07:33:24 +08:00 via Android
    @LimeQAQ 基本都可以绑定,不可以注册
    Harry1993
        9
    Harry1993  
       2021-01-20 07:35:55 +08:00   ❤️ 1
    學術界有個方向叫 Differential Privacy 挺像你描述的:

    https://en.wikipedia.org/wiki/Differential_privacy
    wy7305e
        10
    wy7305e  
       2021-01-20 08:21:47 +08:00 via Android
    用爬虫访问你不会访问的网址。
    用 javascript 随机打开网址。
    写个 userscript 随机搜索。
    jerfoxu
        11
    jerfoxu  
       2021-01-20 09:24:30 +08:00
    混淆的数据总是有规律可循的,如果流行开来也要设置如果防止识别的机制。
    当然与其绕这种弯路,我还是更加的期待去中心化的到来,最起码是多一些想 github 这样的商业性质不大的科技公司。
    imn1
        12
    imn1  
       2021-01-20 11:01:51 +08:00   ❤️ 1
    隐私问题这样说,是针对一个人分析,还是针对一群人的共性分析,就是目的不同,性质就不同
    前者是显然侵犯个人隐私的,后者则是市场需求,但这个目的,只取决于分析人的本意
    #1 说的“特征没有意义”,就是指后者。确实,不关心前者的话,真没必要防

    如果一个酒店分析单一个顾客的入住情况,真是异常奇怪的事,因为这不是市场行为
    但现在流出的那些“个人各地开房记录”,难道不就是各酒店、旅馆收集的么?
    数据迁移了(流出),分析的人不同了,分析的目的不同了,性质就不同了

    又如小区人脸识别门禁,我也相信针对我的小区出入记录分析没什么市场价值,但如果我和物管产生纠纷时呢?这个采集的公司结业时呢?将来会不会有个“个人各地进出记录”的社工库里面有我的身份证和照片?
    港式粤语有个词叫“点错相”,大家了解一下,🐶

    回主题
    沙箱、虚拟机,甚至多硬件设备,是行为隔离的方案
    LZ 说的则是数据污染方案,确实是一个手段,例如我手机通讯录有 1000+个伪造的,以前小米手机提示超过一千条无法同步,现在不知道如何了
    感谢父母,估计他们也没想到,现在 google 搜我的名字,前几十页都是和我同名的某个名人(父母不知道这个人),这个几十年前的数据污染方案太成功了,🐶
    但是,某社工库还是有我,^$%&)__+)#!%^*)(_)^

    但无论前者还是后者,都很难,因为 timeline 问题,电脑记忆数据是不会“遗忘”的,所以这两种方法,能应付一时,但要对付长期、持久的侵犯,个人也要长期、持久地实施的方案,能做到很难,即使做到了,得益者显然是 GDP 数据,很多人因为成本太大放弃了
    举个例子,川皇不是多年以前歧视某某阶层的话都被翻出来了么,虽然他那几句话和现今的话相比真是小巫。但换作自己,那些现在不介意被收集的人,认为小 P 民没有价值的人,是否早已放弃将来“功成名就”了?如果是,那他们的豪言还真是真心话呢,或者说到了功成名就那时,说啥都会成为真理,无所谓了,例如福报

    如果一个社会长期处于这种收集与反收集的抗衡,发展也不会健康,这是往大了说
    往小的说,人们终将会麻木了,因为无时无刻都在收集,各向差异已经磨平,大家就“不介意”了
    nzynzynzy
        13
    nzynzynzy  
       2021-01-20 11:14:13 +08:00
    @LimeQAQ 其实就是一个只能接收短信的海外手机号,没啥太大用。公司有好多我就蹭了一个
    fruitzerg
        14
    fruitzerg  
       2021-01-20 11:28:56 +08:00
    其实我也有这样的想法就是国家出来做虚拟账号他们对接国家接口不能对接不能上架,信息让国家去手机做经济规划。
    fengwn
        15
    fengwn  
       2021-01-20 12:00:31 +08:00
    怎么说呢,隐私这玩意,只要你不尴尬,就是别人尴尬.主要是看个人心态,有的人信息满网飞,别人根本不在乎.
    seesky
        16
    seesky  
       2021-01-20 16:12:28 +08:00
    即使塞满垃圾数据, 但还是可能从一些特定的场景推断出你的隐私信息的真否, 就像你就算用假名字, 如果你和你的孩子老师交流, 对方不可能称呼你的假名字吧? 就算你用充满虚假的数据, 对于后台来说最差的情况就是丢弃, 另外可以使用其他的数据交叉对比可信度.
    其实最好的方法已经有了, 参考 tx 反外挂的那些年, 无论技术再怎么加强, 大佬招多少, 都是游戏不死越反越多. 后面直接送监狱, 才开始收敛不少的.
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   1247 人在线   最高记录 6543   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 30ms · UTC 23:59 · PVG 07:59 · LAX 16:59 · JFK 19:59
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.