V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
cfans1993
V2EX  ›  问与答

我安静地在 linux 下练习 socket,结果 baidu 连上来了

  •  
  •   cfans1993 · 2016-04-01 21:01:12 +08:00 · 3039 次点击
    这是一个创建于 3183 天前的主题,其中的信息可能已经有所发展或是发生改变。

    今天学 socket ,从 windows 下连接 linux ,

    linux 开着 server ,用的 8000 端口,功能就是接受客户端面发来的字符串,然后返回大写的字符串 过了不久,控制台显示百度接上来了

    接收如下

    received from 123.151.42.61 at port 34450
    Received content:GET http://www.baidu.com/ HTTP/1.1
    Host: www.baidu.com
    Accept: */*
    Content-Ty 
    

    另外还有一个其它的

    received from 45.78.0.11 at port 57423
    Received content:GET / HTTP/1.0
    Host: kiwiproxychecker.sioru.com
    
    

    问题来了

    这是百度的爬虫吗,是不是连接信息被跟踪了?我并没有开 httpd 服务

    9 条回复    2016-04-02 17:22:16 +08:00
    id4alex
        1
    id4alex  
       2016-04-01 21:06:26 +08:00
    [root@www data]# nslookup 123.151.42.61
    Server: 100.100.2.138
    Address: 100.100.2.138#53

    ** server can't find 61.42.151.123.in-addr.arpa.: NXDOMAIN

    [root@www data]# nslookup 123.125.71.24
    Server: 100.100.2.138
    Address: 100.100.2.138#53

    Non-authoritative answer:
    24.71.125.123.in-addr.arpa name = baiduspider-123-125-71-24.crawl.baidu.com.

    Authoritative answers can be found from:
    125.123.in-addr.arpa nameserver = ns2.bta.net.cn.
    125.123.in-addr.arpa nameserver = ns.bta.net.cn.
    ns.bta.net.cn internet address = 202.96.0.133
    ns2.bta.net.cn internet address = 202.106.196.28


    你遇到的是假百度
    billlee
        2
    billlee  
       2016-04-01 21:10:42 +08:00   ❤️ 1
    不是,这只是开放代理扫描器,试图通过你的服务器作为代理来访问百度
    littlewey
        3
    littlewey  
       2016-04-01 21:16:30 +08:00 via iPhone
    是搬瓦工上的扫描 bot ?
    cfans1993
        4
    cfans1993  
    OP
       2016-04-01 21:51:15 +08:00
    @littlewey 用 whois 查了 sioru.com 是属于搬瓦工的
    cfans1993
        5
    cfans1993  
    OP
       2016-04-01 21:52:28 +08:00
    @billlee 这一说明白了,谢谢
    jessynt
        6
    jessynt  
       2016-04-01 21:55:29 +08:00   ❤️ 1
    扫描 HTTP 代理的,8000 端口算是代理常用端口了,打开 Baidu 是通过尝试访问百度确认代理 IP 可用性
    UnisandK
        7
    UnisandK  
       2016-04-01 21:57:13 +08:00   ❤️ 1
    GET http://www.baidu.com/ HTTP/1.1
    这已经很清楚的告诉你是把你当代理在访问了
    cfans1993
        8
    cfans1993  
    OP
       2016-04-01 22:06:20 +08:00
    @id4alex 已 get 方法,谢谢
    shiny
        9
    shiny  
       2016-04-02 17:22:16 +08:00 via iPhone
    淘宝上五块钱两万个代理 ip 就是这么来的
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   3406 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 23ms · UTC 11:10 · PVG 19:10 · LAX 03:10 · JFK 06:10
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.