/Data_Science_Portfolio

This repository contains my mentionable progress in Data Science.

Data Science Portfolio

(Last update : 2020.11.26)

This repository contains my mentionable progress in Data Science. The purpose of this work is to organize my knowledge of the field and to self-motivate through the to-do list.

0. Table of Contents

  • Job Description
  • Projects
  • Projects
  • Application
  • Ongoing Study/To-do List
  • Toy Projects (Kaggle)
  • Data Structure/Algorithm



1. Work Experience

  • Job Description

    • Job Title: AI 연구원
    • Work Period: 2019.08 - 2019.12
    • Field: 반도체/디스플레이 등 제조업 스마트팩토리
    • Tasks: L기업, H기업 스마트팩토리 프로젝트 진행
  • Projects

Title Data Type Descrription Preprocessing Model Stack Duration
이미지 양불 판정 Image 반도체/디스플레이 이미지 양불 판정 Object Detection using OpenCV CNN Python, Keras, OpenCV 2019.11 - 2019.12
가상계측 모델 Time series,
structured data
공정 데이터를 활용해 계측값을 예측하는 가상계측 모델을 만들어 계측공정 생략 Anomaly detection, resampling 등 DNN + CNN + biLSTM + Self-Attention Python, Keras, msSQL 2019.10 - 2019.11
R2R(Run-to-Run) 솔루션 연구 Time series 가상계측모델(VM) 구축.
이전 공정변수로부터 피드백을 받아 다음 변수 조절.
--> 계측값의 분산 최소화 및 불량률 감소 기대.
가상데이터를 생성, 노이즈 추가 Linear Regression Python, Statsmodel 2019.10 - 2019.10
이미지 분석 솔루션 개발 Image 이미지 분류 모델을 커스터마이징 할 수 있도록 자체 솔루션 베타버전 개발 내부 알고리즘(이미지 전처리, 모델 아키텍쳐, 하이퍼파라미터 튜닝 등) 구현 CNN Python, Keras, C# 2019.08 - 2019.10

*보안상의 이유로 구체적인 데이터와 성능은 공개하지 않겠습니다.


2. Awards

Name Organizer Problem Prize Article Date
2020 빅데이터
활용 경진대회
더존비즈온,
한국정보화진흥원
주제 1:
대한민국 중소중견기업의 매출 예측
(중소중견기업 10개 분기 데이터를 활용해 다음 분기 매출 예측)

주제 2:
대한민국 유통 활성화를 위한 적요 표준화
(중소중견기업 산업별 회계장부 적요 텍스트 데이터 비지도 분류)
대상 링크 2020.11.03
빅데이터
소셜마케팅
한국경제신문 지체장애인 서울시 저상버스 이용 증진
(데이터 시각화 및 텍스트 분석을 통한 인사이트 기반 마케팅 제안)
장려상 링크 2017.02.11



3. Job-related Education

Timeline



4. Major Projects

  • Projects

Problem Description Dataset Model Stack Last Update
웹앱 개발 코로나아웃::공적마스크 재고 알리미
https://coronaout.kr
마스크재고API,
판매처 영업시간 및 전화번호 크롤링
- Python, HTML, CSS, JavaScript, KakaoMap API 2020.04
감성분석 식당 리뷰에서
가성비/웨이팅/서비스에 대한 감성 분석
망고플레이트
식당 리뷰 크롤링
biLSTM + self-Attention, Boosting(LightGBM) Python, PyTorch, Sklearn, Flask, HTML, CSS, jQuery 2019.06
  • Application

코로나아웃    망고플레이트


5. Study

  • Toy Projects (Kaggle)

  • Recommandation System
Algorithm Dataset
Content Based Filtering tmdb-movie-metadata
Colaborative Filtering movielens-100k-dataset
  • DL
Algorithm Data Type Title Ranking
LSTM Sound TensorFlow Speech Recognition Challenge -
DCGAN Image Simpsons Faces -
Segmentation Image TGS Salt Identification Challenge 2,056 / 3,229
(상위 %0.637%)
CNN Image Dogs vs. Cats Redux: Kernels Edition 28 / 1,314
(상위 %0.021%)
LSTM Text,
structrued data
Mercari Price Suggestion Challenge 47 / 2,382
(상위 0.02%)
LSTM Text Sentiment Analysis on Movie Reviews 22 / 861
(상위 0.026%)
LSTM Text Toxic Comment Classification Challenge 1,451 / 4,550
(상위 0.319%)
  • ML
Problem Algorithm Title Ranking
Regression Mercedes-Benz Greener Manufacturing 11 / 3,831
(상위 0.003%)
Classification San Francisco Crime Classification 61 / 2,332
(상위 0.026%)
Regression Housing Prices Competition for Kaggle Learn Users 298 / 33,855
(상위 0.009%)
Regression Walmart Recruiting - Store Sales Forecasting 11 / 690
(상위 %0.16%)
Classification Otto Group Product Classification Challenge 560 / 3,511
(상위 0.159%)
Classification Medical Appointment Noshows -
Regression Bike Sharing Demand 7 / 3,251
(상위 0.002%)
  • Data Structure/Algorithm

6. Contact