第一步:爬取數(shù)據(jù),實(shí)際上就是根據(jù)一個(gè)網(wǎng)址向服務(wù)器發(fā)起網(wǎng)絡(luò)請(qǐng)求,獲取到服務(wù)器返回的數(shù)據(jù)
第二步:解析數(shù)據(jù),將服務(wù)器返回的數(shù)據(jù)轉(zhuǎn)換為人容易理解的樣式
第三步:篩選數(shù)據(jù),從大量的數(shù)據(jù)中篩選出需要的數(shù)據(jù)
第四步:存儲(chǔ)數(shù)據(jù),將篩選出來(lái)的有用的數(shù)據(jù)存儲(chǔ)起來(lái),如:數(shù)據(jù)庫(kù),CSV文件,Excel文件,JSON文件等
只要小伙伴們按照這四個(gè)步驟操作,實(shí)現(xiàn)一個(gè)爬蟲(chóng)任務(wù)還是很簡(jiǎn)單的