【晨飞】教你如何批量采集Lazada平台上的产品

上次讲了如何批量抓取Tophatter平台的产品数据,第一次接触这个套路的读者可能并不能理解抓取实现过程,没关系,我在 会员区 中专门录制了采集讲解视频,或许有所帮助。掌握批量采集这项技能,我们可以获得很多有价值的数据,比如抓取出最受买家欢迎的产品,产品的平均销售价格,产品的评价情况。结合这些细节信息,深度挖据,开发出目标产品。当然,Tophatter上大部分的中国卖家,大部分产品在1688上都能找到,你也可以将平台上的产品来个乾坤大挪移,快速搬迁到其他平台,早年的暴力铺货就是这么来的。

跨境电商批量采集系列教程二(Lazada)教你如何批量采集Lazada平台上的产品 31

这次来抓取Lazada平台上的产品。如果你是跨境电商行业的老卖家,或多或少知道一些平台对于SKU数量要求的套路。应该说在大部分平台上,新开店铺时,都会被客户经理要求至少要上多少多少数量的SKU,越多越好,尽可能的多。很多新卖家纠结于这300-500个SKU,因为按照原始方式,手动编辑上传,要编的吐血。所以,还是得开动脑筋,找方法,找捷径。Lazada即是如此,甚至还屡次举办上传产品竞赛活动。当然,SKU数量越多,卖家的订单数量并不一定会越多,但或许能让Lazada看起来规模庞大,能卖个好价钱,所以,我想lazada以20亿美元卖给了阿里巴巴,或许有你有我的一份功劳。废话少说,开始采集。

一、分析

考虑到直接采集某一卖家的店铺SKU做演示,会把我骂得狗血淋头。这次还是从分类来采集。打开 https://www.lazada.com.my 网站,在Categories中,随便找一个分类,比如Women Bags为例进行演示。进入到 https://www.lazada.com.my/shop-women-bags/

第一步,分析出列表页规则,找出列表页和内容页之间的关联。因为最终目标是采集产品内容页上的数据,但我们无法直接获得内容页访问地址,所以,列表页的作用就是找到内容页访问地址。

老样子,打开Chrome浏览器,按F12,观察XHR一栏的变化。我们点击列表页最下面的页面数字,,每点一次页面数字,就会看到XHR上出现一个json数据包链接,

https://www.lazada.com.my/shop-women-bags/?ajax=true&page=91

跨境电商批量采集系列教程二(Lazada)教你如何批量采集Lazada平台上的产品 32

按照之前的方法,在浏览器中打开这个json数据包链接,一堆乱码,老样子,把这些数据粘贴到www.json.cn 格式化,找下规律。我们试着提出一个内容页链接地址,去批量查找,发现高达235条记录,但仔细算下一页列表中只有40个产品,显然这不是我们需要的内容。似乎,通过这种方式找到对应内容页链接地址有些麻烦。我们换个方式。

直接打开https://www.lazada.com.my/shop-women-bags/?page=91这个页面的原代码,鼠标反敲右键,查看网页源代码,继续找链接。找个内容页链接地址复制进去搜索,可以看到如下图。

跨境电商批量采集系列教程二(Lazada)教你如何批量采集Lazada平台上的产品 33

好像有点眉目了。我们继续缩小范围, 最后找到这段代码:

productUrl”:”//www.lazada.com.my/products/bagsociety-mg-saffiano-effect-shell-bag-tote-bag-crossbody-sling-bag-black-i135436360-s153414723.html?search=1

二、采集

我们测试下是否符合要求,打开火车采集器。新建任务,命名lazada。在地址格式栏中填入列表页地址,page=后面的数字是变量,这里用地址参数替换,因为这个类目一共有102页,如果要全部采集就写上102.

跨境电商批量采集系列教程二(Lazada)教你如何批量采集Lazada平台上的产品 34

在手动设置规则获取栏中,填入:

Url”:”//www.lazada.com.my/products/bagsociety-mg-saffiano-effect-shell-bag-tote-bag-crossbody-sling-bag-black-i135436360-s153414723.html?search=1

中间的链接地址是个变量,用[参数]替换掉。

得到Url”:”[参数]?search=1

拼接地址得到[参数1]

跨境电商批量采集系列教程二(Lazada)教你如何批量采集Lazada平台上的产品 35

我们测试下能否顺利获得内容页地址,得到结果如下图,每页40个链接,正是我们需要的内容。

跨境电商批量采集系列教程二(Lazada)教你如何批量采集Lazada平台上的产品 36

接下来,可以开始采集产品内容页的内容了。这里仍然以采集产品标题为例,其他字段数据以此类推。复制产品标题文字内容,在源代码中搜索,得到如下图,找出规律。

跨境电商批量采集系列教程二(Lazada)教你如何批量采集Lazada平台上的产品 37

在内容采集规则中,新建一个字段,我们采用前后截取方法,获得标题文字。绿色(*)为通配符,可以替换任何文字。

跨境电商批量采集系列教程二(Lazada)教你如何批量采集Lazada平台上的产品 38测试成功。最后,开始批量采集。

跨境电商批量采集系列教程二(Lazada)教你如何批量采集Lazada平台上的产品 39

找到桌面上的数据文件,打开,所有数据已经保存在里面了。

跨境电商批量采集系列教程二(Lazada)教你如何批量采集Lazada平台上的产品 40

至此,Lazada平台的产品批量采集任务已经搞定,参考这个演示,同样可以将尺寸、重量、图片、描述、亮点等信息完整采集下来。我想,用这种方式对付平台对SKU数量的要求,可以轻而易举搞定。

还是那句话,批量采集不是什么黑科技,确切的说,这是一项从事跨境电商的基本技能。数据是基础,分析处理是方法。采集一大堆数据给到你,可能这是一对垃圾,但是如果结合分析处理,巧妙筛选提取出有价值的内容,可能是一款爆款产品,也可能是对产品改进需求分析,值得尝试的。