獨品網(wǎng)頁批量采集是一款指定區(qū)域指定屬性采集網(wǎng)頁內容的軟件,可自定義過濾條件采集方式,速度快,精確度高,網(wǎng)頁資源批量采集神器。支持循環(huán)地址,按標題保存、任務引用(延伸式多層過濾篩選分工)、自定義函數(shù)(強大的過濾接口,實現(xiàn)更多的可能)。自帶網(wǎng)頁分析工具、函數(shù)編輯工具,界面簡潔,操作簡單、功能強大,是你網(wǎng)路資源收集的得力助手。
用處:
采集discuz、phpwind等論壇博客貼內大圖、貼內文章、貼內鏈接,可限定版塊或排除版塊,還可以指定發(fā)帖作者、帖子內容等。
采集小說文章、軟件鏈接、視頻音樂,可全站查找、按搜索關鍵字查找等。
使用:
簡單型:添加任務>填寫網(wǎng)址>分析頁面>填寫命令>采集下載
詳細型:新建數(shù)據(jù)>添加任務>填寫網(wǎng)址>分析頁面>得到采集命令>填寫過濾函數(shù)>設置參數(shù)>選擇保存路徑>采集>下載
功能:
1、鏈接地址:可以是單個地址也可以循環(huán)地址,還可以是其他任務采集到的所有鏈接地址。 如http://bbs.dupinsoft.com/thread-[1-360]-1-1.html 包括360個頁面
2、采集命令:命令分為兩部分,前一部分為指定區(qū)域,后一部分指定內容,如:<div class=t_f><img src=>(獨品論壇貼內圖片)、<div class=top><text>(區(qū)域內文本)
3、鏈接過濾、采集過濾:均使用函數(shù)過濾,自帶常用過濾函數(shù)find、notfind、findin、notfindin,使用:find(<title><text>,貼圖鑒賞)、notfind(value,image/face)
4、執(zhí)行參數(shù):涉及到采集完成后自動下載、按網(wǎng)頁標題保存、文件重復時跳過、是否保留到IE緩存等
提示:
采集命名可以幫你限定區(qū)域指定目標,精確到屬性,函數(shù)過濾可以幫你過濾篩選,加工到你想要的結果,采集命令和函數(shù)過濾是軟件的兩個強大支撐模塊,善用web工具分析采集命令和編寫修改過濾函數(shù)可以幫你實現(xiàn)更多的不可能,讓軟件變得萬能,采集網(wǎng)頁得心應手。
使用方法
第一步:打開軟件點擊紅色框內的“添加”按鈕創(chuàng)建任務
第二步:選中任務條目,填寫“任務名稱”和“鏈接地址”,然后點擊采集命令右邊的按鈕進入網(wǎng)頁分析窗口
第三步:打開網(wǎng)頁后按住“ALT鍵”移動鼠標到你需要采集的圖片或文字上,紅色區(qū)域會顯示當前目標元素的詳細信息,按"F6"擴大選區(qū)
第四步:分析目標元素,根據(jù)所需的屬性值提取標簽和屬性名稱,這里src屬性得到的是縮略圖,zoomfile得到的是大圖,所以目標組采集命令填寫
第五步:按“F6鍵”擴大選區(qū)直到網(wǎng)頁內需要采集的內容都在紅色邊框內部,然后分析當前元素的屬性,這里得到標簽為div,關鍵屬性取class=t_f,得到的區(qū)域命令為
第六步:將得到的完整采集命令
填入地址欄右邊框內的點擊查看結果,這里取得了所有大圖的地址,若得不到想要的結果需重新分析采集命。
第七步:完善任務信息,填寫采集命令、執(zhí)行參數(shù)、保存路徑等,若想采集完后自動下載添加down參數(shù),以網(wǎng)頁標題保存添加titile參數(shù),點擊“采集”按鈕采集信息,點擊“下載”按鈕下載采集內容
- PC官方版
- 安卓官方手機版
- IOS官方手機版