无意发现了某个城市的 zf 查询的信息接口,果然一看直接把整个表的数据都返回了,一共 30 多个字段毫无保留地保存到本地了!!网站提供的信息只有五六个,但是通过猜字段发现了特别多有用的数据,可以提供更强大的数据查询。如果做成工具牟利会被抓吗?
1
Vegetable 2020-03-05 11:58:58 +08:00
爬取没问题,盈利有问题
|
2
back0893 2020-03-05 11:59:28 +08:00
没有 zf 的信息公示本身就是公开数据
|
3
temporary 2020-03-05 12:10:09 +08:00 1
感觉他公开的字段没问题 但是你发现的那些网页上没显示的应该有问题 可以算你入侵吧
|
4
NerverLibis 2020-03-05 12:14:42 +08:00 via iPhone 1
打 110 询问 -2 分钟解决
找 v 站-水 2 小时 |
5
justzlq 2020-03-05 12:18:06 +08:00
@NerverLibis 110 也不知道的
|
6
opengps 2020-03-05 12:19:33 +08:00 4
是否担负责任主要在于是你不能造成影响,例如:
1,把都对方网站爬挂了(这事常有,新手 tmd 不加间隔猛爬,我遭遇过不下 10 次) 2,把对方某些付费资源消耗了( https 费用,cdn 费用,数据库日志费用等,我在 https 费用上花过钱) 3,数据用于某些不恰当的目的(人家源头免费,你爬取后直接用于收费) 4,爬到了不适合公开的数据(有些数据人家会有删除需求,你继续给人家曝光扩大错误影响的范围显然不合适) |
7
dongisking OP @NerverLibis 打 110 我人没了
|
8
dongisking OP @temporary 俺也觉得
|
9
dongisking OP @opengps 里面很多数据通过其他 zf 文件也能查到,但是那个接口还挺全的
|
10
Takuron 2020-03-05 12:43:18 +08:00 via Android
和 zf 没关系,我记得对于网站的管理没有说不许爬取,但我记得无特别声明不允许进行除正常浏览以外的访问行为,然而大部分爬虫都不是“正常浏览”,所以有法律风险。
zf 网站只是因为别的网站被爬了最多 ban 你的 ip,但要是对 zf 网站造成影响了多半警察会上门。 从互联网道德上讲,正常频率爬取,尊重网站的爬取规则,公开信息你随便爬。 |
11
dongisking OP @Takuron 那问题大不了
|
12
meisky6666 2020-03-05 12:49:50 +08:00 via Android
他不卡就没问题
|
13
just1 2020-03-05 12:58:35 +08:00 2
企查查和天眼查不就活的好好的吗
|
14
herozzm 2020-03-05 13:03:18 +08:00
公开的信息放心爬,别弄崩对方服务器就行,盈利都没问题,上面鼓励民间利用公开信息的
|
15
hst001 2020-03-05 13:20:29 +08:00
公开的数据应该没有问题,问题是怎么确定哪些字段是公开的?
|
16
szx300 2020-03-05 13:23:44 +08:00 via iPhone 6
都是假数据有啥好爬的?
|
17
hikarikun1991 2020-03-05 13:25:56 +08:00
@szx300 哈哈 有道理
|
18
lizytalk 2020-03-05 13:31:29 +08:00
不是无疑的公开信息,而是通过疑似接口的漏洞,这还是有风险的吧。
|
19
losscontrol 2020-03-05 13:42:08 +08:00
这种数据,我存都不敢存
|
20
imydou 2020-03-05 13:49:25 +08:00 via iPhone
这种不明确的,先不说刑事责任,被问询也是很不好受的
|
21
zxy 2020-03-05 13:52:49 +08:00 via iPhone
个人认为是有风险的,还是比较严肃的
|
22
dongisking OP @hst001 是的,他显示在 html 就 5 个多,可是接口有 30 多个字段
|
23
dongisking OP 看来这个还是挺有争议。。。
|
24
Sunrise837 2020-03-05 14:06:41 +08:00
先爬了再说
|
25
zhttty 2020-03-05 14:21:51 +08:00
|
26
huayumo 2020-03-05 14:23:40 +08:00
轻点爬,没一点问题,公开的数据而已
|
27
reus 2020-03-05 14:24:41 +08:00 2
你以为中国是法治国家吗?
|
28
expkzb 2020-03-05 14:28:31 +08:00
猜字段可能有点问题
|
29
huyansheng3 2020-03-05 14:31:38 +08:00
悠着点吧 可能只是接口写的时候偷懒了
|
30
JerryJet 2020-03-05 14:51:53 +08:00 1
法律不了解,但是想办你,找个差不多的罪名就行
|
31
coobin 2020-03-05 15:26:31 +08:00
没有绝对的情况,唯一就是对方看不看得惯。。。
|
32
goodname 2020-03-05 15:39:01 +08:00
猜字段真的有风险,页面上有的问题不大
|
34
cdp2166 2020-03-05 16:28:44 +08:00 via iPhone
天眼查不就是爬的公开数据
|
37
hushao 2020-03-05 19:37:39 +08:00
页面上显示的数据没问题,页面上(也就是普通民众能直观看到的,非技术性获取)没有的数据你爬就属于非授权获取或入侵了。
然后爬的公开数据也不能盈利。你要公开数据,合法;牟利,非法。 |
38
hushao 2020-03-05 19:40:44 +08:00
看你描述的,还有一个问题,非公开的,你要猜测之后再公开。
如果没问题,还好,如果有问题,那就是属于造谣的亲戚或者影响 /破坏公信力的事儿了 |
39
InFaNg 2020-03-05 19:41:34 +08:00
别开几万的并发那种应该没事吧
|
40
jevonszmx 2020-03-05 19:41:50 +08:00
贴一下天眼查的:
免责声明 “天眼查”是由北京金堤科技有限公司开发的一款企业相关数据等公开信息查询工具。根据用户指令,天眼查的搜索引擎系统会以非人工检索方式生成用户检索的已经依法公开的企业信息。天眼查目前数据来源网站主要包括: ·全国企业信用信息公示系统( https://gsxt.saic.gov.cn ) ·中国裁判文书网( https://wenshu.court.gov.cn/Index ) ·中国执行信息公开网( https://zhixing.court.gov.cn/search ) ·国家知识产权局官方网站( https://www.sipo.gov.cn ) ·国家工商总局商标局官方网站( https://sbj.saic.gov.cn ) ·国家版权局官方网站( https://www.ncac.gov.cn ) 天眼查平台所登载的信息均来自于网络公开信息,天眼查仅对相关网站依法公示的信息向用户如实展示,并不主动编辑或修改被所公示网站上的信息的内容或其表现形式。受限于现有技术水平、各信息来源网站更新不同步等原因,对此类信息的展示,并不视为天眼查对其内容的真实性、准确性、完整性、时效性作出任何形式的确认或担保。请您在依据天眼查服务相关信息作出判断或决策前,自行进一步核实此类信息的完整或准确性,并自行承担使用后果。同时,天眼查承诺将不断提升技术水平,逐步完善服务信息来源质量与更新频次,为您提供更高质量的服务。 |
41
Tyuans 2020-03-05 20:02:49 +08:00
那些查公司的,不也都是爬来的公开的信息,然后转手让你开 vip 查看所谓的企业全部信息,好像找工作前用用他们的软件就知道这家公司坑不坑了似的。
|
42
tengyoubiao 2020-03-05 20:15:21 +08:00 via Android
|
43
ajaxfunction 2020-03-05 21:24:33 +08:00
没关系,反而爬大公司的才有法务给你挖坑
zf 关注的是和谐稳定,只要你的行为没有引起舆论,也没有伤害他们的利益,他们才不会把时间浪费在你身上 |
44
ceyes 2020-03-06 01:42:41 +08:00 via iPhone
通过猜测的方式得到一些非公开信息,这不是非授权访问吗?好比他服务器存在若口令,然后你 123456 给试进去了再下载些数据,就算没有下载数据主动提交漏洞都有很大风险的,想想乌云和世纪佳缘的那个案子。
|
45
reus 2020-03-06 08:18:25 +08:00 via Android
@zhttty 法治水平低的国家。要封锁消息时就训诫,要平息民怨时就给先进称号。
继续洗,继续舔,看看铁拳打到你头上时,法律帮不帮得到你。 |
46
huangdongdonghdd 2020-03-06 09:08:49 +08:00 via iPhone
@reus #45 封锁消息?指的是最近新冠疫情时美国英国等一票皿主国家的做法吗?
|
47
NaiveSimpleYoung 2020-03-06 09:16:39 +08:00
@huangdongdonghdd 他指的中国啊
|
48
RouJiANG14 2020-03-06 10:36:25 +08:00
公开数据应该没有啥吧,不公开的数据应该也不会上网的。
|
49
lbingl 2020-03-06 13:16:57 +08:00 via Android
@huangdongdonghdd 英美封锁了个锤子消息?外国有疫情你们这些国内的知道的比人家本国人民都快。
|
50
reus 2020-03-06 15:19:12 +08:00
@huangdongdonghdd 哟,装外宾呢?
|
51
julyclyde 2020-03-06 15:54:40 +08:00
就知识产权来说,公布的内容属于 public domain 可以免费无限制使用
但你得注意别把人家网站压垮了,否则犯破坏计算机信息系统罪 |
52
ts8zs 2020-03-07 22:53:25 +08:00
举个例子 专利查询
|