非专业的nlp、图像工程师,tensorflow调包工程师,注重快速实现,那么,让我们一起做点有趣的事情吧! 这个工程的目的是将自己在工程和学术研究中,一些应用到深度学习的思路和方法整理汇总出来:
- 帮助深度学习入门同学快速上手
- 提供一些在现有的机器学习方向上的新的方向和思路的整理
- 解锁思维的禁锢
关于深度学习相关的浅入浅出的介绍,可以快速入门一下浅入浅出深度学习理论实践。
关于深度学习相关的点击预估的介绍,可以快速入门一下yoho注册概率预估。
关于深度学习相关的图像识别的介绍,可以快速入门一下基于SSD下的图像内容识别(一),基于SSD下的图像内容识别(二)。
关于深度学习相关的目标向量化的介绍,可以快速入门一下深度学习下的电商商品推荐。
关于深度学习相关的多层感知机的介绍,可以快速入门一下基于Tensorflow实现多层感知机网络MLPs。
关于深度学习相关的deepfm的介绍,可以快速入门一下基于Tensorflow实现DeepFM。
关于深度学习相关的Deep Neural Networks for YouTube Recommendations的介绍,可以快速入门一下利用DNN做推荐的实现过程总结。
关于深度学习相关的RCNN_GRU的介绍,实在没空写博客了,sorry
关于深度学习相关的TextCNN的介绍,实在没空写博客了,sorry
关于深度学习相关的Bert做fine-tune的代码(类似接口,具体实现按照时间项目去改),我每次做nlp的baseline的时候,都是在这个代码上进行更改,主要是ner和classify两个问题的模版,可以快速入门一下Bert你需要知道的一些细节
利用GRU,提取用户的行为时序稀疏特征,并产出stack初始层的思路
利用全连接+CNN,提取稀疏特征,并产出stack初始层的思路
Google 推荐算法的代码修正,原始代码来源于网络但是不能执行及流程不完整,修复代码demo,现可以直接复制后使用
网络结构
注意
在Linux环境下,tensorflow==1.0.0会有如下的报错,而MacBook环境下,tensorflow=1.0.0就不会报错:
double free or corruption (!prev): 0x0000000001f03dd0 ***
解决方法是更新版本到1.6.0(其他版本我没试),官方之前有人提过issue,大家注意一哈!
利用ssd直接实现物体区域识别
图片版效果:
视频版本地址:
利用样本频率+Huffman树路径最大概率的方法,实现特征向量化的思路
最近在利用来自google的YouTube团队发表在16年9月的RecSys会议的论文Deep Neural Networks for YouTube Recommendations做用户个性化商品推荐,看到不少论文上的理论总结分析,都很精彩,我手动实现了一遍,总结了一些实际工程中的体会,给大家也给自己一个总结交代。
normal_version:按照论文未修改的basemodel
attention_version:在basemodel的基础上,加了attention机制(线性attention/rnn attention)
record_dataformat_version:在basemodel的基础上,利用record机制存储数据,加快训练速度
- RCNN_GRU/model: 初始化模型的脚本
- RCNN_GRU/process: 数据预处理的脚本
在做黄反广告文本的识别:
- 初版本是朴素贝叶斯+LR(recall:72%,precision:88%)
- 优化版是CBOW+LR(recall:77%,precision:88%)
- 进阶版是CBOW/GLOVE+MLR(recall:85%,precision:91%)
- 当前版是[D2V,CBOW,GLOVE]+TextCNN(recall:90%,precision:92%)
Bert+BiLSTM+Crf/FNN,关于Bert的更多可以参考我的ppt分享
- python 3.6
- tensorflow 1.0.0
- nltk 3.2.4
- jieba 0.39
- data_preprocessing 0.0.2