This Repository contains following 3 kinds of projects what I have done as a self-taught ML/NLP Enthusiast.
I've also published several articles on Medium about Data Science and Natural Language Processing.
これまで個人で実装してきた機械学習理論や自然言語処理のコードがまとめてあります.
機械学習や自然言語処理に関する記事をMediumに投稿しています. -> Coldstart.nlp on Medium
Title | Detail |
---|---|
Environment | MacOS Mojave 10.14.3 |
Language | Python(core), R, HTML5, CSS3 |
Library | Tensorflow, Kras, Scikit-learn, Chainer, Genism, NLTK, Scipy, Numpy, Seaborn |
Database | MySQL, PostgreSQL |
-
- Automatic Encoder-Decoder Seq2Seq: English Chatbot Seq2Seqによる英語チャットボット.
- Encoder-Decoder Seq2Seq with Attention: English-Japanese Machine Translation アテンションを用いた日英翻訳.
- Bidirectional LSTM: Abstract Text Summarization 双方向LSTMを用いた文脈を捉える抽象型文章要約.
- GRU: Text_Generation GRUリカーレントネットワークを用いた文章生成.
-
- CNN and RNN: Image Caption Generation VGG16とGloveで転移学習を行なった画像キャプション生成.
- Convolutional Neural Network: Speech Recognition 畳み込みニューラルネットワークを用いた音声認識.
- OpenCV: Text Extraction from Image 画像からテキスト情報を抽出する文字起こし機能の実装.
-
- Question-Answer Recommendation Engine from Kaggle 現在進行中 on process
-
- Doc2Vec: Hate Speech Detection from Tweet Doc2Vecを用いたツイートからのヘイトスピーチ検出.
- Topic Model by LDA: News Contents Classification 潜在的ディリクレ配分法(LDA)を用いたコンテンツ分類.
- TF-idf and NaiveBayes: Author Identification Tf-idfとナイーブベイズ分類器による著者判定.
- Gaussian Naive Bayes for text: Spam Filter for e-mail ナイーブベイズ分類器によるEメールスパムフィルター.
- CNN for Long Text: News Article Classifications 長文テキストにCNNを用いたニュース記事分類.
- Bidirectional LSTM: Sentiment Analysis on reviews 双方向LSTMを用いた映画レビューにおける感情分析.
- Stacked RNN vs Simple RNN: Sentiment Analysis on movie review 複数のRNNを用いた感情分類.
- LSTM for Tweet: Sentiment Analysis on Twitter LSTMを用いたツイートに対する感情分析.
- LSTM with Chainer: Text Classification ChainerによるLSTMを用いた文章分類のモディフィケーション.
-
- Regression: Mercari Price Suggestion Challenge: 現在進行中 on process mercariにおける出品アイテムの価格予測.
-
- Preprocessing Simplest Code-kit for NLP 自然言語処理における前処理Tips&Code.
-
- OpenCV: Human Face Detection from Image 画像から人間の顔部分を特定.
- Convolutional Neural Network for Image: Dog or Cat 画像から犬か猫かを見分けるバイナリ分類タスク.
- CNN: Sign Language Images Classification 畳み込みニューラルネットワークを用いた手話画像識別.
- Simple Neural Network: Hand-written Digits Classification ニューラルネットワークによる手書き数字認識.
- CNN: Hand-written Digits Classification 畳み込みニューラルネットワークによる手書き数字文字.
- [GANs for Image: Generative Adversarial Network] 現在進行中 on process
- [Inception from google: Train image classifier with Inception] 現在進行中 on process
-
- Collaborative Filtering with SVD: Book Recommender System 特異値分解と協調フィルタリングによる本の推薦.
- Content Based by Cosine Similarity: Movie Recommender System Tfidfとコサイン類似度による映画の推薦.
-
- Regression: HR Salary Prediction スポーツ選手のシーズン中のパフォーマンスからの年収予想.
- Simple RNN for Time-Series Data: Apple Stock Price Prediction リカーレントネットワークを用いた株価予測.
- Regression: Boston House Price 線形回帰によるボストン地区の不動産価格予測.
- Regression: Multi-layerNN_for_Regression_BHP 多層ニューラルネットワークによるボストン地区の不動産価格予測.
-
- Classification: IBM Attrition Prediction from Kaggle: IBM社員データを利用した退職者予測.
- First Neural Network from scratch 分類タスク向けのディープラーニングフロムスクラッチ.
-
- 1. Data Preparation: Scraping and Web API, here Medium: スクレイピングやウェブAPIによるデータの準備.
- 2. Data Visualization: Which Graph should I use?, here Medium: データの可視化におけるグラフの種類と使い分け.
- 3. Data Cleaning Phase on Medium, here Medium: 前処理におけるTips&code集.
- 4. Feature Engineering Phase on Medium, here Medium: 次元削除と特徴量生成メソッド.
- 5. Apply Multiple Machine Learning Model Phase on Medium, here Medium: 機械学習アルゴリズムとその比較.
- 6. Model Validation Phase on Medium, here Medium: モデルの評価指標とその選び方.
- 7. Hyperparameter Tuning Phase on Medium, here Medium: ハイパーパラメータチューニング.
- 8. Gradient Descent and Optimization Algorithm, here Medium: 勾配降下と最適化アルゴリズム.