crawler_ETL_NLP

將目前和爬蟲,ETL和語言處理有關的專案代碼集中整理存放。

  • crawler_104work.py 104爬蟲。

  • crawler_BestOfWine.py BestOfWine網站針對威士忌爬取資料。

  • crawler_BestOfWine_asyncio.py BestOfWine網站針對威士忌爬取資料,使用異步訪問。

  • crawler_cocktail_uk.py | crawler_cocktail_uk_singlepage 爬取cocktail.uk的調酒資訊

  • crawler_flavior.py 爬取flavior威士忌資訊

  • crawler_ptt_content.py 爬取ptt八卦版文章並儲存

  • make_whiskey_vector.py | make_whiskey_vector2.py 生成威士忌風味特徵矩陣的兩個方案

  • word2vec_medwltraining 用word2vec訓練風味矩陣的模型