推广 热搜: 公司  快速  上海  中国  未来    企业  政策  教师  系统 

Python中requests库的用法详解

   日期:2024-10-31     作者:caijiyuan    caijiyuan   评论:0    移动:http://keant.xrbh.cn/news/11054.html
核心提示:requests是使用Apache2 licensed 许可证的HTTP库。比urllib模块更简洁。Request支持HTTP连接保持和连接池,支持使用cookie

requests是使用Apache2 licensed 许可证的HTTP库。比urllib模块更简洁。

Python中requests库的用法详解

Request支持HTTP连接保持和连接池,支持使用cookie保持会话,支持文件上传,支持自动响应内容的编码,支持国际化的URL和POST数据自动编码。

在python内置模块的基础上进行了高度的封装,从而使得python进行网络请求时,变得人性化,使用Requests可以轻而易举的完成浏览器可有的任何操作。

requests是第三方库,需要独立安装:pip install requests。requests是基于urllib编写的,并且使用起来非常方便,个人推荐使用requests。

官方中文教程地址:http://docs.python-requests.org/zh_CN/latest/user/quickstart.html

学习之前推荐一个非常好的http测试网站:http://httpbin.org,提供非常非常完善的接口调试、测试功能

requests支持http的各种请求,比如

GET: 请求指定的页面信息,并返回实体主体。
HEAD: 只请求页面的首部。
POST: 请求服务器接受所指定的文档作为对所标识的URI的新的从属实体。
PUT: 从客户端向服务器传送的数据取代指定的文档的内容。
DELETE: 请求服务器删除指定的页面。
OPTIONS: 允许客户端查看服务器的性能。
访问baidu,获取一些基本信息

请求后响应的内容是requests.models.Response对象,需要处理后才能得到我们需要的信息。

requests自动检测编码,可以使用属性查看。

无论响应是文本还是二进制内容,我们都可以用属性获得对象

  • encoding:获取当前的编码
  • encoding = ‘utf-8’ :设置编码
  • headers :以字典对象存储服务器响应头,但是这个字典比较特殊,字典键不区分大小写,若键不存在则返回None
  • requests.headers :返回发送到服务器的头信息
  • cookies :返回cookie
  • history :返回重定向信息,当然可以在请求是加上allow_redirects = false 阻止重定向
  • status_code :响应状态码
  • raw :返回原始响应体,也就是 urllib 的 response 对象,使用 r.raw.read()
  • ok :查看r.ok的布尔值便可以知道是否登陆成功
  • raise_for_status() :失败请求(非200响应)抛出异常
  • text: 得到的是str类型,会自动根据响应头部的字符编码进行解码。
  • content:得到的是bytes类型,需要进行解码Response_get.content.decode(),相当于Response_get.text。字节方式的响应体,会自动为你解码gzip 和 deflate 压缩。
  • json(): Requests中内置的JSON解码器,以json形式返回,前提返回的内容确保是json格式的,不然解析出错会抛异常

其实使用requset.text避免乱码的方式还有一个,就是发出请求后,获取内容之前使用response.encoding属性来改变编码,例如

  • url:请求url地址
  • headers:请求头
  • params:查询字符串

对于带参数的URL,传入一个dict作为参数,如果值为None的键不会被添加到url中。

结果为

requests的方便之处还在于,对于特定类型的响应,例如JSON,可以直接获取

requests里的json方法就是封装了json.loads方法。

控制台打印结果

需要传入HTTP Header时,我们传入一个dict作为headers参数

添加头信息访问

equests对cookie做了特殊处理,使得我们不必解析cookie就可以轻松获取指定的cookie

要在请求中传入cookie,只需准备一个dict传入参数

  • url:请求url地址
  • headers:请求头
  • data:发送编码为表单形式的数据

要发送POST请求,只需要把get()方法变成post(),然后传入data参数作为POST请求的数据

打印结果

requests默认使用对POST数据编码。如果要传递JSON数据,可以直接传入json参数

文件上传需要用到请求参数里的参数

在读取文件时,注意务必使用即二进制模式读取,这样获取的长度才是文件的长度。

响应结果

request更加方便的是,可以把字符串当作文件进行上传

1、session会话维持
会话对象requests.Session能够跨请求地保持某些参数,比如cookies,即在同一个Session实例发出的所有请求都保持同一个cookies,而requests模块每次会自动处理cookies,这样就很方便地处理登录时的cookies问题。

auth:认证,接受元祖

基本身份认证(HTTP Basic Auth)

简写

另一种非常流行的HTTP身份认证形式是摘要式身份认证,Requests对它的支持也是开箱即可用的:

如果代理需要用户名和密码,则需要这样

现在的很多网站都是https的方式访问,所以这个时候就涉及到证书的问题

例如访问12306

会报错,证书错误

解决:加上verify=false(默认是true)

timeout,单位:毫秒

使用GET或OPTIONS时,Requests会自动处理位置重定向。

Github将所有的HTTP请求重定向到HTTPS。可以使用响应对象的 history 方法来追踪重定向。 我们来看看Github做了什么:

Response.history 是一个:class:Request 对象的列表,为了完成请求而创建了这些对象。这个对象列表按照从最老到最近的请求进行排序。

如果你使用的是GET或OPTIONS,那么你可以通过 allow_redirects 参数禁用重定向处理:

  1. stream:是否下载获取的内容
  2. cert:保存本地SSL证书路径

所有的异常都是在requests.excepitons中

示例

测试可以发现,首先被捕捉的异常是timeout超时异常,当把网络断掉就会捕捉到ConnectionError连接异常,如果前面异常都没有捕捉到,最后也可以通过RequestExctption捕捉到。

  • 构建参数:在构建请求参数时,第一种需要将请求参数使用urllib库的urlencode方法进行编码预处理,非常麻烦。
  • 请求方法:发送get请求时,第一种使用的urllib库的urlopen方法打开一个url地址,而第二种直接使用requests库的get方法,与http请求方式是对应的,更加直接、易懂。
  • 请求数据:第一种按照url格式去拼接一个url字符串,显然非常麻烦,第二种按顺序将get请求的url和参数写好就可以了。
  • 处理响应:第一种处理消息头部、响应状态码和响应正文时分别使用.info()、.getcode()、.read()方法,第二种使用.headers、.status_code、.text方法,方法名称与功能本身相对应,更方便理解、学习和使用。
  • 连接方式:看一下返回数据的头信息的“connection”,使用urllib库时,“connection”:“close”,说明每次请求结束关掉socket通道,而使用requests库使用了urllib3,多次请求重复使用一个socket,“connection”:“keep-alive”,说明多次请求使用一个连接,消耗更少的资源。
  • 编码方式:requests库的编码方式Accept-Encoding更全。
本文地址:http://lianchengexpo.xrbh.cn/news/11054.html    迅博思语资讯 http://lianchengexpo.xrbh.cn/ , 查看更多
 
标签: 详解 用法
 
更多>同类行业资讯
0相关评论

新闻列表
企业新闻
推荐企业新闻
推荐图文
推荐行业资讯
点击排行
网站首页  |  关于我们  |  联系方式  |  使用协议  |  版权隐私  |  网站地图  |  排名推广  |  广告服务  |  积分换礼  |  网站留言  |  RSS订阅  |  违规举报  |  粤ICP备2023022329号