/NewsRS

News Recommendation System

Primary LanguagePython

NewsRS: News Recommendation System

STARTUP

Initialization

$ pip3 install jieba,numpy,pandas,gensim
# or conda install jieba,numpy,pandas,gensim
# or pip3 install -r requirements.txt
# or conda install --yes --file requirements.txt
$ git init
$ git remote add origin git@github.com:XingwXiong/NewsRS.git
$ git pull origin master
$ cd data; tar xzf user_click_data.tar.gz

Classification

  • data/news_jieba.csv : pandas.DataFrame 格式, 对数据集中的所有新闻 jieba 分词;
  • data/news_vector.csv: pandas.DataFrame 格式, 列名为news_id, 每一列是长度为100的news向量(news 向量是通过gensim.model.Doc2Vec得到的);
  • data/usr_vector.csv: pandas.DataFrame 格式, 列名为usr_id, 每一列是长度为100的usr向量(usr 向量是由训练数据中每个用户访问的所有新闻的向量平均值得来的);