基于python爬虫模拟登陆豆瓣#爬虫教程#

技术 作者:有料 2018-12-13 16:18:48
一、简介 工具:Google chrome python 爬虫登陆方式一般有两种: 第一种:使用post登陆,即需要输入账号密码等选项, 第二种:使用cookies登陆,即把已登陆好账号的cookies拷贝到代码中, 两种方式各有优缺,第一种可能再代码运行中会出现验证码选项,需要写验证码方面的代码, 第二种较为方便。   二、获取需要的数据   我们以豆瓣电影《战狼2》为例,详细介绍如何获取这些数据 电影地址: https://movie.douban.com/subject/26363254/ 我们要爬取的是短评,打开短评页: 地址: https://movie.douban.com/subject/26363254/comments?sort=new_score&status=P 1、打开开发者模式: 按F12键,或者页面右键点击”检查“,或者设置--开发者模式,三种方法都可以 打开后如图: 2、在左侧登陆豆瓣账号,右侧分别点击 Network ,ALL, Name下面的login,如下图: 获取post数据: 在login的Headers下面,Form Data下面就是post登陆需要的数据 获取cookie数据: 在Name下面找到comments?sort=new_score&status=P(网址的后半截),右边的headers找到cookie, 即我们要的cookie数据,直接复制下来 同时,login也有cookie,但是不知道这两者的区别是什么, ​ 参考: https://blog.csdn.net/c091728/article/details/78347915 --------------------- 作者:bailixuance 来源:CSDN 原文:https://blog.csdn.net/bailixuance/article/details/84715924 版权声明:本文为博主原创文章,转载请附上博文链接!

关注公众号:拾黑(shiheibook)了解更多

[广告]赞助链接:

四季很好,只要有你,文娱排行榜:https://www.yaopaiming.com/
让资讯触达的更精准有趣:https://www.0xu.cn/

公众号 关注网络尖刀微信公众号
随时掌握互联网精彩
赞助链接