1
52boobs 253 天前 via Android
看得出来你对个人信息保护不太了解,嗯,个人信息这一块是法律禁止公司直接出卖个人信息的,但是如果用个人个人数据训练出来的模型是属于公司的资产,so…
|
2
ho121 253 天前
啥?微信不是不保存聊天记录吗?
|
3
qq525266 OP @52boobs 我当然知道明面上公司是需要获取用户权限才能获得用户信息的,并且对用途有规定,但是微信都有权利阅读、审批、撤回、甚至提交用户的聊天记录到某些地方了,你认为它真的会“保护”你的信息吗
|
4
chhtdd 253 天前
答案是肯定的,不能守着金山去要饭吧
|
5
sujin190 253 天前 via Android
如果微信这样的数据的话,训练出来的模型说不定随便一问说不定就透露用户个人信息了,这也没办法公开用吧,而且还不说各种家庭群 10 万加+乱七八糟的东西了,高质量的模型需要高质量的数据,所以其实说起来真没啥用
|
6
QlanQ 253 天前
我觉得肯定会,只是看这东西能不能拿来用
公司通过关键词 搜索量 和 访问次数,生成 热搜 和 推荐 是不是类似 |
7
Mikawa 253 天前
|
9
TenProX 253 天前 via iPhone
这还用问,多多少少肯定是会的。你要说完全不会,那是写在纸上让人看的。让你看是一回事,他们怎么做又是另一回事。
|
10
cherryas 253 天前
理论上是违法的。实际就不知道了
|
11
cbythe434 253 天前
完全不敢做。
体制内、企业各种敏感内容太多了。随便有一些信息泄漏,一纸文件自己基本盘都要受影响。 |
12
s642153378 253 天前
必然会的,数字资产是新质生产力[狗头]
|
14
52boobs 253 天前 via Android
@qq525266 so ,大概你也明白现状了。商业公司不太可能守着金山要饭,何况不少互联网巨头公司都曾使用脱敏的数据做一些数据方面的研究(说的就是你 google),在国内,拥有相似资源的公司就更……
|
15
22too 253 天前 1
理论上不敢,实际上也不敢。
最多做做内部的关键词过滤算法,其他的别想了。 这个不是金山,在国内是烫手山芋。 |
17
zhangdp 253 天前
很早以前接触过 im 软件服务端开发虽说后来项目没启动,但是前期调研设计的时候似乎记得好像法规有规定服务端必须存两个月的聊天记录以供公安机关检查的
|
18
otakustay 253 天前
可以炼,但要从中找出高质量的语料的难度……哈哈哈哈哈
|
19
736531683 253 天前
上面天真了,理论上确实法规不允许直接保存用户聊天记录,但是没说不能学习文字提取后的 logits ,还有差分和模糊各种手段。
数据不出机,照样可以训练,不然你以为互联网公司的高估值哪来的? |
20
736531683 253 天前
深度学习时代,最重要的就是数据,大公司要做的就是怎么不触犯法律的情况下尽量利用数据。
|
21
phrack 252 天前 via iPhone
微信聊天消息质量上看应该挺垃圾的,都是口水话,训练出来个客服专员不得了了
|