V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
Aleksandr
V2EX  ›  问与答

一个简单的 Python 爬虫,模拟登录,有问题,大神帮忙看下

  •  
  •   Aleksandr · 2018-07-23 13:04:53 +08:00 · 1237 次点击
    这是一个创建于 2307 天前的主题,其中的信息可能已经有所发展或是发生改变。

    公司的网站,想做个工具爬取跟工作相关的内容,但登录总是失败。 爬虫纯新手,大佬帮忙看下? import requests from requests.packages import urllib3 from http.cookiejar import CookieJar

    urllib3.disable_warnings()

    headers = {

    "User-Agent":"Mozilla/5.0 (Macintosh; Intel Mac OS X 10_12_4) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.36"
    

    }

    url = "https://clm.patac.shanghaigm.com/ccm/auth/authrequired" s = requests.Session() data = { 'j_username': '******', 'j_password': '******' }

    response = s.post(url, data=data, verify = False,headers = headers) print(response.text)

    本来要爬的网页是 https://clm.patac.shanghaigm.com/ccm/web,爬这个网页会重定向到 https://clm.patac.shanghaigm.com/ccm/auth/authrequired,所以我干脆 post 了 https://clm.patac.shanghaigm.com/ccm/auth/authrequired,不过代码执行下来,虽然 是 200 的状态码,但明显不是登录成功的页面,求指教。。。

    目前尚无回复
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2860 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 23ms · UTC 13:39 · PVG 21:39 · LAX 05:39 · JFK 08:39
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.