Response对象

    属性名 作用
    url HTTP相应的 URL地址,str类型的
    status HTTP响应状态码,int类型的(在pycharm的控制台中你可以看到,例如200,404)
    body HTTP响应正文,bytes类型
    text 文本形式的HTTP响应正文,str类型,由response.body使用response.encoding解码得到(代码见表格下方)
    encoding HTTP响应正文的编码(有时候会出现烦人的乱码问题,那你得注意是不是这个属性出问题了)
    request 产生该HTTP响应的Requset对象
    meta response.request.meta 在构造request对象的时候,可以将要传递个响应处理函数的信息通过meta参数传入;响应处理函数处理响应时候,通过response.meta将信息取出
    selector (这个比较重要了)选择器对象用来提取response中的数据
    xpath(query) 即xml路径语言,用来确定xml文档中某部分位置的语言(html属性xml)。这个家伙厉害了,从下载的页面中提取数据,少了它可不行
    css(query) 也是一种选择器,用来提取页面内中的数据,但是不如xpath强大。(CSS即层叠样式表,css选择器比xpath要简单一点,但是底层还是会调用xpath)
    urljoin(url) 用来构造绝对url,(爬取页面的时候跳转到第二页的时候需要重新构造request,这个时候用的到这个属性)