591售屋網-Python爬蟲

一隻591售屋網新建案的爬蟲

Luca Chuang
Mar 8, 2021

本篇文章是給有需要的讀者直接使用,即使不會Python也能照著步驟操作抓到資料,並不是爬蟲的教學,如果有疑問或建議的歡迎留言討論。

上周收到了前實習同事的訊息,想問我有沒有快速從591售屋網上把多筆新建案的建案詳情抓下來的方法,想一想之前有練習抓過股票的資訊,這應該也大同小異,於是就爽快的答應了,沒想到抓表格跟抓網頁資訊原來差這麼多,幸好找到了許多網路資源,幫助我學習解決問題,最後成功做出這隻爬蟲,也讓我多習得一項技能,放在這裡給有需要的讀者使用。

感謝 Yao-Jen Kuo 台大系統訓練班的Python爬蟲基礎教學
感謝 Alan Syue 591租屋網爬蟲的爬蟲架構
感謝 python爬蟲-解決網頁中取不到的資訊-"真假網頁" 幫我解決抓不到連結的問題

爬蟲連結

我是在Google Colab上面寫的,所以即使使用公司電腦,沒裝Python也可以執行,會Python的朋友可以直接使用,連結:

操作說明

1.點選Open in Colab

2. 執行第一區Code

3. 點選連結做帳號認證(為了資料儲存在你使用的drive帳號中)

4.複製驗證碼並貼回第一行Code下方的空個,並按Enter

5.在最後一區Code中設定

  • output_file_name: 設定存放位置與檔名
  • rid: 設定縣市
  • sid: 設定地區
  • totalpages: 設定頁數

6.在執行階段選全部執行

7.在驗證帳號的Drive中就可以找到輸出的檔案

如果這篇文章對你有幫助,麻煩幫我拍手和留言讓我知道,另外有想要抓取什麼資料也可以跟我說,如果我有興趣我也會試著挑戰看看!

--

--

Luca Chuang
Luca Chuang

Written by Luca Chuang

Consultant | Salesforce, Python, R, SQL, Tableau, SAS, Solver, JMP|Linkedin: https://www.linkedin.com/in/shen-wei-luca-chuang-33978b57

Responses (4)