选择器

根据标签选择

response.selector.xpath('//title')

根据css选择

response.selector.css('title')
response.selector.css('.title span')

根据class选择

response.selector.xpath('//div[@class="area"]')

数据处理

只需要获取里面的文本

response.selector.xpath('//title/text()')
response.selector.css('title::text')

把对象变成文本

response.selector.xpath('//title/text()').extract()

只要获取第一个

response.selector.xpath('//title/text()').extract_first(default='not-found')  # 没有default会返回None, 不会报错

获取其他属性

response.selector.xpath('//a').xpath('@href')
response.selector.xpath('//a/@href')
response.selector.css('a::attr(href)')