聯系官方銷售客服
1835022288
028-61286886
火車頭多圖采集的設置方法用于多文件和圖片專用字段
轉發的
相信很多剛開始學習火車頭的菜鳥們,也和爛泥一樣使用的是火車頭免費版,然后為我們的zencart網站進行一些產品數據的采集。但是在寫采集規則的時候,會經常碰到的一個問題就是如何采集一個產品的多張圖片。
采集一張圖片的規則,相信大家都會寫了。那么多張圖片呢?如何寫呢?其實,這個和我們寫采集一張圖的是一樣的,只是在一些細節上面設置正確就ok了。下面我就自己采集的一個站點給各位做一下講解。
我們知道要采集一個網站的圖片,那么我們肯定是在火車頭使用img標簽來進行的。
要采集多張圖片,我們肯定要找出來這些圖片在源碼中的代碼。我下面舉例來進行講解:
在上圖中是標記出來的1和2是兩張不同的圖片,但是我們仔細的觀察可以發現img標簽中,如果把圖片的源地址和alt去掉的話,那么其他的都是一樣的。而火車頭有一個標簽循環使用的功能,這就為我們采集多張圖片提供了一個方便。我現在把源碼粘貼出來:
<img src="域名/_img/PRODUCTS/320/PromGirl-767611310.jpg" width="68" border="0" alt="Long One Shoulder Formal Dress P641 TI-P641" />
然后在火車頭中進行采集規則的編寫:
在數據提取方式中,我們選擇了“正則提取”,而“正則匹配內容”中填寫如下:
<img src="域名/_img/PRODUCTS/[參數]/[參數]"(*)width="(*)"(*)border="(*)"(*)alt="(*)"(*)/>
組合結果中填寫如下:
<img src="域名/_img/PRODUCTS/[參數1]/[參數2]"/>
其中正則匹配內容第一個“參數”對應的是組合結果中的“參數1”,正則匹配內容第二個“參數”對應的是組合結果中的“參數2”,而其中的“*”是任意匹配的意思。
上圖是設置好后,采集測試的結果
這個是導出的結果。
Ok,以上我們可以看到要采集多張圖片,只要我們設置好了采集標簽,然后此標簽可以循環使用,就可以達到我們要的結果了……
哎,你這個太麻煩了,根本不需要存到本地,直接入庫,調用系統接口直接入庫就行,他會自己存到本地,后臺配置了七牛云什么的,會上傳到七牛云
回復@www.18html.com
回復@琉惗
該文章來源于網絡,
這里我想表達的是,如何采集多圖,
而不是入庫,入庫我還沒寫!
入庫是不需要采集的!
后面再寫怎么入庫
回復@www.18html.com ?? 想看看是什么
回復@www.18html.com 學習學習
回復@www.18htm此內容需要回復后才能看到********l.com
學學
學習學習回復@www.18ht回復內容查看詳情ml.com
回復@www.18html.com 看啊可能