酷知百科網

位置:首頁 > 遊戲數碼 > 互聯網

阿里媽媽淘寶聯盟寶貝採集方法

互聯網1.48W

本文介紹使用採集器採集阿里媽媽淘寶聯盟(以衣服爲例)的方法
本文僅以阿里媽媽淘寶聯盟衣服搜尋結果頁面舉例說明,大家如果有其他採集淘寶聯盟商品的需求,可以更換搜尋關鍵詞進行採集。
採集內容爲:
商品圖片地址,商品標題,店鋪名,銷量,商品價格,佣金,比率,商品連結

阿里媽媽淘寶聯盟寶貝採集方法

操作方法

(01)步驟1:創建採集任務1)進入主介面,選擇“自訂採集”

阿里媽媽淘寶聯盟寶貝採集方法 第2張

(02)2)將要採集的網站URL複製粘貼到輸入框中,點擊“儲存網址”

阿里媽媽淘寶聯盟寶貝採集方法 第3張

(03)3)儲存網址後,鼠標點擊輸入框,在右側操作提示框中,選擇“輸入文字”

阿里媽媽淘寶聯盟寶貝採集方法 第4張

(04)4)然後輸入採集的商品,點擊確定

阿里媽媽淘寶聯盟寶貝採集方法 第5張

(05)5)  網絡加載速度比較慢,所以需要設定執行前等待,爲防止輸入框沒加載完畢操作失效還需要設定出現元素。

阿里媽媽淘寶聯盟寶貝採集方法 第6張

(06)然後點擊搜尋,並選擇“點擊該按鈕”

阿里媽媽淘寶聯盟寶貝採集方法 第7張

(07)由於網頁涉及Ajax技術。所以需要選中點擊元素,開啟“進階選項”,勾選“Ajax加載數據”,設定時間爲“5秒”。 因爲頁面開啟後需要向下滑動纔可以出現更多內容,所以還需要設定頁面滾動,滾動次數選擇30次,每次間隔2秒,選擇向下滾動一屏完成後,點擊“確定”。

阿里媽媽淘寶聯盟寶貝採集方法 第8張

(08)步驟2:創建翻頁循環1)將頁面下拉到底部,找到下一頁按鈕,鼠標點擊,在右側操作提示框中,選擇“循環點擊單個連結”

阿里媽媽淘寶聯盟寶貝採集方法 第9張

(09)2)同上,此步驟也需要設定進階選項,開啟“進階選項”,勾選“Ajax加載數據”,設定時間爲“3秒”。 因爲頁面開啟後需要向下滑動纔可以出現更多內容,所以還需要設定頁面滾動,滾動次數選擇30次,每次間隔1秒,選擇向下滾動一屏完成後,點擊“確定”

阿里媽媽淘寶聯盟寶貝採集方法 第10張

(10)步驟3:採集阿里媽媽淘寶聯盟商品資訊1)移動鼠標,選中第一個商品圖片,標題,店鋪名,系統會自動識別出相似的元素,在提示框中選擇“選中全部”,隨後點擊採集圖片地址或者採集以下元素文字。

阿里媽媽淘寶聯盟寶貝採集方法 第11張

(11)2)如果要採集商品連結,價格,佣金,比率,銷量的話,則要寫xpath才能實現採集。以採集價格字段舉例:首先選擇添加特殊字段

阿里媽媽淘寶聯盟寶貝採集方法 第12張

(12)然後選中該字段,選擇自訂數據字段(下圖紅色框中的)

阿里媽媽淘寶聯盟寶貝採集方法 第13張

(13)隨後選擇自訂定位元素方式,並按下圖填入XPah。價格的元素匹配的XPath爲//div[1]//div[@class="content-line clearfix mt5"]/span[1]相對Xpath勾上,並填入//div[@class="content-line clearfix mt5"]/span[1]需要注意的事,Xpath會隨着網站結構的改變而改變,所以上面xpath不能確保一直有效。如果要採集這些數據,建議學習一下Xpath:

阿里媽媽淘寶聯盟寶貝採集方法 第14張

(14)填好xpath之後,隨後在自訂數據字段->自訂抓取方式中選擇抓取文字即可。

阿里媽媽淘寶聯盟寶貝採集方法 第15張

(15)同理,如果要採集佣金,比率,商品連結分別設定爲:佣金:元素匹配的XPath爲//div[1]//div[@class="content-line clearfix"]/span[2]相對Xpath勾上,並填入//div[@class="content-line clearfix"]/span[2]自訂數據字段->自訂抓取方式中選擇抓取文字商品連結:元素匹配的XPath爲//div/a[@class="search-box-img img-loaded"]相對Xpath勾上,並填入//div/a[@class="search-box-img img-loaded"]自訂數據字段->自訂抓取方式中選擇抓取超連結(a標籤的href)比率:元素匹配的XPath爲//div[1]//div[@class="content-line clearfix"]/span[1]相對Xpath勾上,並填入//div[@class="content-line clearfix"]/span[1]自訂數據字段->自訂抓取方式中選擇抓取文字銷量:元素匹配的XPath爲//div[1]//div[@class="content-line clearfix mt5"]/span[2]相對Xpath勾上,並填入//div[1]//div[@class="content-line clearfix mt5"]/span[2]自訂數據字段->自訂抓取方式中選擇抓取文字設定完成以後,可以看到數據都在字段中了:

阿里媽媽淘寶聯盟寶貝採集方法 第16張

(16)3)然後再選擇‘’啓動本地採集”

阿里媽媽淘寶聯盟寶貝採集方法 第17張

(17)步驟4:數據採集及匯出1)採集完成後,會跳出提示,選擇“匯出數據”選擇“合適的匯出方式”,將採集好的數據匯出這裏我們選擇excel作爲匯出爲格式,一份完好的阿里媽媽淘寶聯盟商品資訊就匯入出來了,數據匯出後如下圖

阿里媽媽淘寶聯盟寶貝採集方法 第18張