將目前和爬蟲,ETL和語言處理有關的專案代碼集中整理存放。
-
crawler_104work.py
104爬蟲。
-
crawler_BestOfWine.py
BestOfWine網站針對威士忌爬取資料。
-
crawler_BestOfWine_asyncio.py
BestOfWine網站針對威士忌爬取資料,使用異步訪問。
-
crawler_cocktail_uk.py | crawler_cocktail_uk_singlepage
爬取cocktail.uk的調酒資訊
-
crawler_flavior.py
爬取flavior威士忌資訊
-
crawler_ptt_content.py
爬取ptt八卦版文章並儲存
-
make_whiskey_vector.py | make_whiskey_vector2.py
生成威士忌風味特徵矩陣的兩個方案
-
word2vec_medwltraining
用word2vec訓練風味矩陣的模型