爬取电商网站的信息
step 1: 比如在一个网站搜索纸尿裤, 我们在google chrome的更多工具中点击开发者工具
step 2:
1 .选择web scrapper
2 .选择create new sitemap
3 .选择select, 然后在商品页面选择能够覆盖商品所有信息的位置,然后点击done selecting, 选择mulitple
step3:
done selecting后,你发现selector第四个字段是link_54224078139(这个是特点商品的编号),我们去除它,使他泛化,变成div.search_prolist_info
step4: 点击save selector,用element preview查看效果是否所有页面都包含
step5: 点击item,然后创建新的selector
流程基本一样,但是不选择multiple,然后评论字段的regex写[0-9]+