V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
EricJia
V2EX  ›  问与答

京东个人订单爬虫违法吗?

  •  
  •   EricJia · 2020-10-13 14:19:47 +08:00 · 3082 次点击
    这是一个创建于 1502 天前的主题,其中的信息可能已经有所发展或是发生改变。
    如题, 想获取个人京东的订单, 用于记账 App 的数据导入, (会让用户运行爬虫, 提交订单文件到 App), 发现了 info spider https://infospider.vercel.app/#/?id=info-spider,

    然而只支持 windows, 个人改了改支持 mac 了, 先在有两个疑问

    1. 我可以在 GitHub 上公开吗?
    2. 会不会有什么隐私 /法律相关的问题?
    15 条回复    2020-10-14 03:34:58 +08:00
    opengps
        1
    opengps  
       2020-10-13 14:20:49 +08:00
    建议不要对需要登陆状态的数据进行爬取
    EricJia
        2
    EricJia  
    OP
       2020-10-13 20:26:44 +08:00
    @opengps #1 交给用户自己爬, 自己只公开代码也不行吗?
    opengps
        3
    opengps  
       2020-10-13 20:30:44 +08:00
    @EricJia 我的意思并非确定的说算违法, 法律上对于这块目前尚处于模糊阶段。你没办法预估到将来是否会判定为违法
    EricJia
        4
    EricJia  
    OP
       2020-10-13 20:32:32 +08:00
    @opengps #3 好的,我现在看到爬虫都有点担惊受怕, 感觉只能个人偷偷用, 但是像 京价保之类的插件 应该也算违法了吧?
    opengps
        5
    opengps  
       2020-10-13 20:44:06 +08:00
    @EricJia 未必。 是否判定为违法:一是看是否法律明确规定禁止,被禁止则必然违法;二是看对方是否提起诉讼引起法律讨论,讨论结果可能属于违法。
    按照这个边界,去谨慎开发就行,有些需求从一开始就是危险的,自己研究没人追究一般触碰不到违法边缘,但是要公开服务获利,还是慎重为妙。
    我个人感觉,你这个记账需求,是至少出发点没“未经用户允许”,还不至于担心这个。毕竟即使不用工具,用户自己也能复制出来页面信息
    opengps
        6
    opengps  
       2020-10-13 20:46:02 +08:00
    需要慎重处理的就是,别因为你的工具,给京东造成严重后果。我网站当时被人疯狂爬取的时候,1 核的 cpu 爆满到无法连接上服务器
    EricJia
        7
    EricJia  
    OP
       2020-10-13 21:28:07 +08:00
    @opengps #5 感谢您的回复, 我写的爬虫仅限于让用户 自己手动执行 获取自己的订单记录, 没有公开服务,我只是提供了公开源代码。

    我看了很多新闻, 如果给网站带来严重后果 /侵犯用户隐私 /不正当牟利, 基本就进去了。

    1. 带来严重后果: 用户自己执行,疯狂爬不把自己账号 block 了?
    2. 侵犯用户隐私: 同上,应该是没问题,用户完全之情,并且主动运行代码的。
    3. 比较麻烦,毕竟我提供这个工具, 是为了方便 App 用户的,App 本身存在收费行为。
    opengps
        8
    opengps  
       2020-10-13 21:32:22 +08:00
    @EricJia 注意在免责协议,强调下不得用于其他用途
    EricJia
        9
    EricJia  
    OP
       2020-10-13 21:52:41 +08:00
    @opengps #8 https://github.com/ericjjj/jdorders/blob/main/README.md 您看下合适吗? 参考了 crawlab
    opengps
        10
    opengps  
       2020-10-13 22:10:02 +08:00
    @EricJia 写的水平很高,水平远在我之上,可以请教专业人看下!
    lxilu
        12
    lxilu  
       2020-10-14 00:13:37 +08:00 via iPhone
    「等非法手段」病句
    black11black
        13
    black11black  
       2020-10-14 00:31:45 +08:00
    看了看,没必要为了这么个小项目考虑这么多,有什么一定要把这个东西贴到 github 上的理由吗?
    EricJia
        14
    EricJia  
    OP
       2020-10-14 03:34:44 +08:00   ❤️ 1
    @127000 #11 感谢
    EricJia
        15
    EricJia  
    OP
       2020-10-14 03:34:58 +08:00
    @black11black #13 要公开, 但是怕法律问题
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2817 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 33ms · UTC 13:40 · PVG 21:40 · LAX 05:40 · JFK 08:40
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.