/fb-mining

Primary LanguagePython

訓練模型:
1. Crawler.R
	從FB抓貼文 //要再分開寫一個
	儲存在id/g-id.csv
2. prettify.py
	前處理
	儲存在id/g-id-c.csv
3. features.py
	定義模型特徵值
	儲存在features.txt
4. get_features.py
	定義貼文特徵值
	儲存在id/g-id-n.csv
5. train.py
	訓練模型
	儲存在model.m

使用分類器:
1. Crawler.R
	從FB抓貼文 -> {id}.csv (cp950)
2. preprocess.py
	前處理     -> {id}-c.csv (utf8)
3. classify.py
	定義貼文特徵值 -> {id}-c.csv (utf8)
	丟分類器       -> {id}.csv (utf8)

其他:
autoscript.bat:呼叫automate.py並設定參數0
automate.py:接受一參數n,指定日期為當前日期的第前n-1天
	呼叫Crawler.R,preprocess.py,classify.py,new_hashing.py
	例:執行日期為9/11,n=0,則抓取並處理9/10的貼文
rundays.bat:抓取並處理20天內的貼文

文件格式:
{id}.csv: 貼文原始資料, classification
{id}-c.csv: id, prettified-message, feature