学完验证码自动识别以后,学习cookie和session.

今天学习的特别艰难,首先是时过境迁,网站已经发生了很多变化,很多操作跟着老师来已经实现不了了,很难找到合适的网站。另一个问题就是浏览器,火狐浏览器的抓包工具和Chrome的不太一样...导致我的学习进度十分缓慢,再者就是我的操作很多失误,一直没有得到想要的结果,好在现在已经解决了,不过还是要多加练习比较好。

cookie 的介绍:

某些网站为了辨别用户身份,进行Session跟踪而储存在用户本地终端上的数据(通常经过加密),由用户客户端计算机暂时或永久保存的信息 。比如说,我们在电脑上登录了淘宝的网页,但是当我们下次打开时依旧是登录的状态,这就是cookie发挥的作用,将用户的信息数据存储起来了。

同时还要学习session:

-1.可以进行请求的发送

-2.如果请求过程中产生了cookie,则该cookie会被自动存储/携带在该session对象中

本次需求:使用cookie模拟登录人人网。

首先我们在浏览器中登录人人网,使用抓包工具查看一下页面。

登录后会有一个login的post请求,我们点开后可以看到下面的cookie还有一些data。

下面就是一会要发post请求时data里的参数:

现在打开pycharm开始模拟登录。

首先导包。

接着,我们要对网页做一个post请求,url也是login请求里的url(这里出错过),然后再将参数都输入。而且要创建一个Session类的实例session,后面的requests都将改成session。

这样我们就爬取了当前用户的个人主页对应的页面数据,接下来就要使用携带cookie的session进行get请求的发送。

查看一下运行结果:

现在生成了一个叫做renren.html的html文件,我们使用浏览器打开

依旧是登录的状态,表示成功。

刚刚翻看了一下之前的文件,发现又忘记了不少内容,决定写一篇复习了。(开始挖坑),毕竟我的存货快没了QAQ!!

现在为止我对cookie和session的了解还不够深入,现在去查看资料好好了解一下,加深理解。