1 xpath or css

  1. # 节点选择
  2. response.xpath('//*[@id="yxyz_content"]/table[2]/tbody/tr[13]/td')
  3. resposne.css('#yxyz_content table:nth-child(2) tbody tr:nth-child(13) td')
  4. # 获取内容
  5. response.xpath('//span/text()').get()
  6. response.css('span::text').get()
  7. # 获取属性
  8. response.css('base').attrib['href']
  9. response.xpath('//base/@href').get()
  10. response.css('base::attr(href)').get()
  • xpath和css均返回一个Selector对象,可混合使用
  • get方法只返回第一个,getall或extract返回全部的列表