/deep_learning

基础的深度学习实验研究结果汇总笔记

Primary LanguagePythonMIT LicenseMIT

介绍

非专业的nlp、图像工程师,tensorflow调包工程师,注重快速实现,那么,让我们一起做点有趣的事情吧! 这个工程的目的是将自己在工程和学术研究中,一些应用到深度学习的思路和方法整理汇总出来:

  • 帮助深度学习入门同学快速上手
  • 提供一些在现有的机器学习方向上的新的方向和思路的整理
  • 解锁思维的禁锢

关于深度学习相关的浅入浅出的介绍,可以快速入门一下浅入浅出深度学习理论实践

关于深度学习相关的点击预估的介绍,可以快速入门一下yoho注册概率预估

关于深度学习相关的图像识别的介绍,可以快速入门一下基于SSD下的图像内容识别(一)基于SSD下的图像内容识别(二)

关于深度学习相关的目标向量化的介绍,可以快速入门一下深度学习下的电商商品推荐

关于深度学习相关的多层感知机的介绍,可以快速入门一下基于Tensorflow实现多层感知机网络MLPs

关于深度学习相关的deepfm的介绍,可以快速入门一下基于Tensorflow实现DeepFM

关于深度学习相关的Deep Neural Networks for YouTube Recommendations的介绍,可以快速入门一下利用DNN做推荐的实现过程总结

关于深度学习相关的RCNN_GRU的介绍,实在没空写博客了,sorry

关于深度学习相关的TextCNN的介绍,实在没空写博客了,sorry

关于深度学习相关的Bert做fine-tune的代码(类似接口,具体实现按照时间项目去改),我每次做nlp的baseline的时候,都是在这个代码上进行更改,主要是ner和classify两个问题的模版,可以快速入门一下Bert你需要知道的一些细节

项目

RNN_applied_classification

利用GRU,提取用户的行为时序稀疏特征,并产出stack初始层的思路

CNN_applied_classification

利用全连接+CNN,提取稀疏特征,并产出stack初始层的思路

网络结构

Wide & Deep

Google 推荐算法的代码修正,原始代码来源于网络但是不能执行及流程不完整,修复代码demo,现可以直接复制后使用

网络结构

注意

在Linux环境下,tensorflow==1.0.0会有如下的报错,而MacBook环境下,tensorflow=1.0.0就不会报错:

double free or corruption (!prev): 0x0000000001f03dd0 ***

解决方法是更新版本到1.6.0(其他版本我没试),官方之前有人提过issue,大家注意一哈!

SSD_object_recognition

利用ssd直接实现物体区域识别

图片版效果:

视频版本地址:

行人识别场景

车辆识别场景

Word2vec_recommend

利用样本频率+Huffman树路径最大概率的方法,实现特征向量化的思路

MLPs

最简单的入门级神经网络算法 多层感知机网络

DeepFm

入门级别的CTR Prediction的神经网络算法 DeepFM的网络结构图

可能感兴趣的其他相关内容:FM部分||FFM部分

Deep Neural Networks for YouTube Recommendations

最近在利用来自google的YouTube团队发表在16年9月的RecSys会议的论文Deep Neural Networks for YouTube Recommendations做用户个性化商品推荐,看到不少论文上的理论总结分析,都很精彩,我手动实现了一遍,总结了一些实际工程中的体会,给大家也给自己一个总结交代。 Deep Neural Networks for YouTube Recommendations

normal_version:按照论文未修改的basemodel

attention_version:在basemodel的基础上,加了attention机制(线性attention/rnn attention)

record_dataformat_version:在basemodel的基础上,利用record机制存储数据,加快训练速度

RCNN_GRU

  • RCNN_GRU/model: 初始化模型的脚本
  • RCNN_GRU/process: 数据预处理的脚本

TextCNN

在做黄反广告文本的识别:

  • 初版本是朴素贝叶斯+LR(recall:72%,precision:88%)
  • 优化版是CBOW+LR(recall:77%,precision:88%)
  • 进阶版是CBOW/GLOVE+MLR(recall:85%,precision:91%)
  • 当前版是[D2V,CBOW,GLOVE]+TextCNN(recall:90%,precision:92%)

Bert

Bert+BiLSTM+Crf/FNN,关于Bert的更多可以参考我的ppt分享

工具

  • python 3.6
  • tensorflow 1.0.0
  • nltk 3.2.4
  • jieba 0.39
  • data_preprocessing 0.0.2

其他