guoday/ICME2019-CTR

extract_features

chen849157649 opened this issue · 0 comments

郭大,你好,我最近在研读你的代码,有问题不懂
def w2v(train_df,test_df,f,flag,L):
# word2vec 即通过一个嵌入空间使得语义上相似的单词在该空间内距离很近
# 在这里是,利用word2vec来表示用户观看的相似作品在该空间内距离很近
print("w2v:",f)
sentence=[]
dic={}
day=0
# 分别对f='item_id', f='author_id'
for item in train_df[['day','uid',f]].values:
if day!=item[0]:
for key in dic:
# 将第0天用户看过的全部放入sentence
sentence.append(dic[key])
dic={}
day=item[0]
print(day)
# dic统计用户uid 看过哪些作品
try:
# 第1天开始这句似乎不会执行了
dic[item[1]].append(str(item[2]))
except:
dic[item[1]]=[str(item[2])]
for key in dic:
sentence.append(dic[key])

为啥将初始第0天要区别处理呢? 从第1天开始try 内部的似乎不会运行