爬取电商网站的信息
step 1: 比如在一个网站搜索纸尿裤, 我们在google chrome的更多工具中点击开发者工具

step 2:
1 .选择web scrapper
2 .选择create new sitemap
3 .选择select, 然后在商品页面选择能够覆盖商品所有信息的位置,然后点击done selecting, 选择mulitple
step3:
done selecting后,你发现selector第四个字段是link_54224078139(这个是特点商品的编号),我们去除它,使他泛化,变成div.search_prolist_info

step4: 点击save selector,用element preview查看效果是否所有页面都包含

step5: 点击item,然后创建新的selector
流程基本一样,但是不选择multiple,然后评论字段的regex写[0-9]+
step6: 保存selector
如果要怕所有页,可以去Sitemap下选择edit metadata来设置

step7: 回到root,然后选择sitemap的下拉菜单的Scrape

step8: 点击start scraping

step9: Sitemap选择browse,可以查看所有data
