选择器
根据标签选择
response.selector.xpath('//title')
根据css选择
response.selector.css('title')
response.selector.css('.title span')
根据class选择
response.selector.xpath('//div[@class="area"]')
数据处理
只需要获取里面的文本
response.selector.xpath('//title/text()')
response.selector.css('title::text')
把对象变成文本
response.selector.xpath('//title/text()').extract()
只要获取第一个
response.selector.xpath('//title/text()').extract_first(default='not-found') # 没有default会返回None, 不会报错
获取其他属性
response.selector.xpath('//a').xpath('@href')
response.selector.xpath('//a/@href')
response.selector.css('a::attr(href)')