您好,匿名用户

正则表达式匹配“\xa0”的问题

0 投票

在scrapy中使用正则表达式匹配“xa0”的问题:

html是这样的

<div>数量:100-200个    </div>

要取出100-200个,其他不要。

解析:

response.xpath('/html/body/div/text()').re_first('数量:(.+)\s$')

解析结果是:

100-200个\xa0\xa0\xa0

xa0对应html中的&nbsp,html中有4个&nbsp,解析结果有3个xa0,怎么修改正则表达式可以去掉解析结果的3个xa0

用户头像 提问 2017年 5月22日 @ Lancer 上等兵 (538 威望)
分享到:

2个回答

0 投票

'数量:(\S+)'

用户头像 回复 2017年 5月22日 @ Jayce 中士 (1,071 威望)
0 投票
用户头像 回复 9月5日 @ yaoxuemei 上等兵 (111 威望)
提一个问题:

相关问题

0 投票
1 回复 102 阅读
用户头像 提问 2014年 9月19日 @ Lux 中士 (1,092 威望)
0 投票
1 回复 25 阅读
0 投票
1 回复 66 阅读
用户头像 提问 2017年 3月31日 @ Quinn 下士 (907 威望)
0 投票
1 回复 67 阅读
用户头像 提问 2012年 12月1日 @ Dr. Mundo 下士 (861 威望)

欢迎来到随意问技术百科, 这是一个面向专业开发者的IT问答网站,提供途径助开发者查找IT技术方案,解决程序bug和网站运维难题等。
温馨提示:本网站禁止用户发布与IT技术无关的、粗浅的、毫无意义的或者违法国家法规的等不合理内容,谢谢支持。

欢迎访问随意问技术百科,为了给您提供更好的服务,请及时反馈您的意见。
...