591售屋網-Python爬蟲
一隻591售屋網新建案的爬蟲
Mar 8, 2021
本篇文章是給有需要的讀者直接使用,即使不會Python也能照著步驟操作抓到資料,並不是爬蟲的教學,如果有疑問或建議的歡迎留言討論。
上周收到了前實習同事的訊息,想問我有沒有快速從591售屋網上把多筆新建案的建案詳情抓下來的方法,想一想之前有練習抓過股票的資訊,這應該也大同小異,於是就爽快的答應了,沒想到抓表格跟抓網頁資訊原來差這麼多,幸好找到了許多網路資源,幫助我學習解決問題,最後成功做出這隻爬蟲,也讓我多習得一項技能,放在這裡給有需要的讀者使用。
感謝 Yao-Jen Kuo 台大系統訓練班的Python爬蟲基礎教學
感謝 Alan Syue 591租屋網爬蟲的爬蟲架構
感謝 python爬蟲-解決網頁中取不到的資訊-"真假網頁" 幫我解決抓不到連結的問題
爬蟲連結
我是在Google Colab上面寫的,所以即使使用公司電腦,沒裝Python也可以執行,會Python的朋友可以直接使用,連結:
操作說明
1.點選Open in Colab
2. 執行第一區Code
3. 點選連結做帳號認證(為了資料儲存在你使用的drive帳號中)
4.複製驗證碼並貼回第一行Code下方的空個,並按Enter
5.在最後一區Code中設定
- output_file_name: 設定存放位置與檔名
- rid: 設定縣市
- sid: 設定地區
- totalpages: 設定頁數
6.在執行階段選全部執行
7.在驗證帳號的Drive中就可以找到輸出的檔案
如果這篇文章對你有幫助,麻煩幫我拍手和留言讓我知道,另外有想要抓取什麼資料也可以跟我說,如果我有興趣我也會試著挑戰看看!