如何高效率地使用Python 走訪資料夾中的檔案| External Brain

文章推薦指數: 80 %
投票人數:10人

原本想改用Multi Thread / Process 的方式處理,無奈自己也不太熟悉。

最後則是改採glob 模組,讓搜尋資料夾中XML 檔的效率增加,整體的作業 ... 2020-06-16 Dev 範例程式碼glob走訪特定副檔名的檔案os.walk走訪資料夾os.scandir小結參考資料 最近一個工作需求是要爬近TB等級的資料,資料的儲存格式是散落在各資料夾中的XML檔。

然而實際爬蟲發現IO的瓶頸反而不是處理XML檔及萃取資料並寫入資料庫中,瓶頸是出現



請為這篇文章評分?