⑴Instant Data Scraper插件是一款为电商卖家用户准备的辅助工具,在爬取当前页面的同时,也可以同时爬取其他多个页面数据。还可以设置最小和最大延迟时间,在你页面动态加载信息时,延迟爬取页面信息,采集类似淘宝评论一样的信息,非常适合电商卖家下载使用。
⑵Instant Data Scraper插件完全在用户的中运行,并且不会将数据发送到Web Robots。该插件可以将多页数据检索到一个文件中。在YP,Yelp,Ebay,Amazon,Craigslist,Walmart,BestBuy等热门网站中,Instant Data Scraper插件均可使用,并且无需使用者具备编码技能。
⑶以采集淘宝某商品评论为例子,首先,进入商品详情页,然后点击浏览器工具栏中的此插件图标,Instant Data Scraper将开始自动识别并提取当前表格类型的数据,如图所示,该chrome插件准确地将此商品的评价分类爬取。
⑷如果默认的爬取不是你想要的结果,可以点击Try another table按钮,则会重新识别其他代替表,你可以一直切换,知道找寻到你所需要采集的内容。
⑸、同时爬取多页面数据
⑹Instant Data Scraper插件检测的是当前网页的表格数据,你可以点击Locate Next button ,并选择下一步按钮或者页面上的其他链接位置,即可将多个页面的数据爬取到同一文件中。
⑺你可以设置最小延迟和最大延迟时间,时间将以秒为单位,当页面动态加载信息时,可以增加它。
⑻点击Instant Data Scraper插件爬取页面上的对应按钮,即可将检测到的数据表格直接下载保存为CSV和XLSX格式文件。
⑼下载插件,并在浏览器安全提示时选择【保留】,在下载文件夹中找到下载好的文件,后缀是.crx 。
⑽说明:若出现安全提示,请选择保留。这是浏览器的默认设置,我们的插件不会危害你的计算机。
⑾、打开扩展程序安装页面
⑿复制并粘贴到地址栏,按回车键进入扩展程序安装页面,打开右上角的【开发者模式】。
⒀将下载好的.crx文件拖拽到到扩展安装页面内,等待数秒,在安装弹窗内点击添加即可。