基于python爬虫模拟登陆豆瓣#爬虫教程#
一、简介
工具:Google chrome
python 爬虫登陆方式一般有两种:
第一种:使用post登陆,即需要输入账号密码等选项,
第二种:使用cookies登陆,即把已登陆好账号的cookies拷贝到代码中,
两种方式各有优缺,第一种可能再代码运行中会出现验证码选项,需要写验证码方面的代码,
第二种较为方便。
二、获取需要的数据
我们以豆瓣电影《战狼2》为例,详细介绍如何获取这些数据
电影地址:
https://movie.douban.com/subject/26363254/
我们要爬取的是短评,打开短评页:
地址:
https://movie.douban.com/subject/26363254/comments?sort=new_score&status=P
1、打开开发者模式:
按F12键,或者页面右键点击”检查“,或者设置--开发者模式,三种方法都可以
打开后如图:
2、在左侧登陆豆瓣账号,右侧分别点击 Network ,ALL, Name下面的login,如下图:
获取post数据:
在login的Headers下面,Form Data下面就是post登陆需要的数据
获取cookie数据:
在Name下面找到comments?sort=new_score&status=P(网址的后半截),右边的headers找到cookie,
即我们要的cookie数据,直接复制下来
同时,login也有cookie,但是不知道这两者的区别是什么,
参考:
https://blog.csdn.net/c091728/article/details/78347915
---------------------
作者:bailixuance
来源:CSDN
原文:https://blog.csdn.net/bailixuance/article/details/84715924
版权声明:本文为博主原创文章,转载请附上博文链接!
关注公众号:拾黑(shiheibook)了解更多
[广告]赞助链接:
四季很好,只要有你,文娱排行榜:https://www.yaopaiming.com/
让资讯触达的更精准有趣:https://www.0xu.cn/
关注网络尖刀微信公众号
随时掌握互联网精彩
随时掌握互联网精彩
赞助链接
排名
热点
搜索指数
- 1 奋力谱写西部大开发新篇章 4925928
- 2 常州副市长越挖越宝藏 4942543
- 3 准“00后”女干部破格提拔任副镇长 4800215
- 4 星火成炬|宇宙级别的浪漫 4712128
- 5 刚开业价值300万黄金被洗劫一空 4621252
- 6 男孩骑车失误刹车把手插进大腿里 4547033
- 7 美国务卿访华 台湾问题摊牌 4470703
- 8 男子求助:26岁妻子与朋友爬山失联 4310881
- 9 港珠澳大桥变“鬼桥”系误导 4292949
- 10 校长涉嫌诈骗近5000万 其母被骗百万 4122885