属性名 | 作用 |
---|---|
url | HTTP相应的 URL地址,str类型的 |
status | HTTP响应状态码,int类型的(在pycharm的控制台中你可以看到,例如200,404) |
body | HTTP响应正文,bytes类型 |
text | 文本形式的HTTP响应正文,str类型,由response.body使用response.encoding解码得到(代码见表格下方) |
encoding | HTTP响应正文的编码(有时候会出现烦人的乱码问题,那你得注意是不是这个属性出问题了) |
request | 产生该HTTP响应的Requset对象 |
meta | response.request.meta 在构造request对象的时候,可以将要传递个响应处理函数的信息通过meta参数传入;响应处理函数处理响应时候,通过response.meta将信息取出 |
selector | (这个比较重要了)选择器对象用来提取response中的数据 |
xpath(query) | 即xml路径语言,用来确定xml文档中某部分位置的语言(html属性xml)。这个家伙厉害了,从下载的页面中提取数据,少了它可不行 |
css(query) | 也是一种选择器,用来提取页面内中的数据,但是不如xpath强大。(CSS即层叠样式表,css选择器比xpath要简单一点,但是底层还是会调用xpath) |
urljoin(url) | 用来构造绝对url,(爬取页面的时候跳转到第二页的时候需要重新构造request,这个时候用的到这个属性) |