(Last update : 2020.11.26)
This repository contains my mentionable progress in Data Science. The purpose of this work is to organize my knowledge of the field and to self-motivate through the to-do list.
- Job Description
- Projects
2. Awards
- Projects
- Application
5. Study
- Ongoing Study/To-do List
- Toy Projects (Kaggle)
- Data Structure/Algorithm
6. Contact
-
- Job Title: AI 연구원
- Work Period: 2019.08 - 2019.12
- Field: 반도체/디스플레이 등 제조업 스마트팩토리
- Tasks: L기업, H기업 스마트팩토리 프로젝트 진행
Title | Data Type | Descrription | Preprocessing | Model | Stack | Duration |
---|---|---|---|---|---|---|
이미지 양불 판정 | Image | 반도체/디스플레이 이미지 양불 판정 | Object Detection using OpenCV | CNN | Python , Keras , OpenCV |
2019.11 - 2019.12 |
가상계측 모델 | Time series, structured data |
공정 데이터를 활용해 계측값을 예측하는 가상계측 모델을 만들어 계측공정 생략 | Anomaly detection, resampling 등 | DNN + CNN + biLSTM + Self-Attention | Python , Keras , msSQL |
2019.10 - 2019.11 |
R2R(Run-to-Run) 솔루션 연구 | Time series | 가상계측모델(VM) 구축. 이전 공정변수로부터 피드백을 받아 다음 변수 조절. --> 계측값의 분산 최소화 및 불량률 감소 기대. |
가상데이터를 생성, 노이즈 추가 | Linear Regression | Python , Statsmodel |
2019.10 - 2019.10 |
이미지 분석 솔루션 개발 | Image | 이미지 분류 모델을 커스터마이징 할 수 있도록 자체 솔루션 베타버전 개발 | 내부 알고리즘(이미지 전처리, 모델 아키텍쳐, 하이퍼파라미터 튜닝 등) 구현 | CNN | Python , Keras , C# |
2019.08 - 2019.10 |
*보안상의 이유로 구체적인 데이터와 성능은 공개하지 않겠습니다.
Name | Organizer | Problem | Prize | Article | Date |
---|---|---|---|---|---|
2020 빅데이터 활용 경진대회 |
더존비즈온, 한국정보화진흥원 |
주제 1 :대한민국 중소중견기업의 매출 예측 (중소중견기업 10개 분기 데이터를 활용해 다음 분기 매출 예측) 주제 2 :대한민국 유통 활성화를 위한 적요 표준화 (중소중견기업 산업별 회계장부 적요 텍스트 데이터 비지도 분류) |
대상 | 링크 | 2020.11.03 |
빅데이터 소셜마케팅 |
한국경제신문 | 지체장애인 서울시 저상버스 이용 증진 (데이터 시각화 및 텍스트 분석을 통한 인사이트 기반 마케팅 제안) |
장려상 | 링크 | 2017.02.11 |
Problem | Description | Dataset | Model | Stack | Last Update |
---|---|---|---|---|---|
웹앱 개발 | 코로나아웃::공적마스크 재고 알리미 https://coronaout.kr |
마스크재고API, 판매처 영업시간 및 전화번호 크롤링 |
- | Python , HTML , CSS , JavaScript , KakaoMap API |
2020.04 |
감성분석 | 식당 리뷰에서 가성비/웨이팅/서비스에 대한 감성 분석 |
망고플레이트 식당 리뷰 크롤링 |
biLSTM + self-Attention, Boosting(LightGBM) | Python , PyTorch , Sklearn , Flask , HTML , CSS , jQuery |
2019.06 |
- Recommandation System
Algorithm | Dataset |
---|---|
Content Based Filtering | tmdb-movie-metadata |
Colaborative Filtering | movielens-100k-dataset |
- DL
Algorithm | Data Type | Title | Ranking |
---|---|---|---|
LSTM | Sound | TensorFlow Speech Recognition Challenge | - |
DCGAN | Image | Simpsons Faces | - |
Segmentation | Image | TGS Salt Identification Challenge | 2,056 / 3,229 (상위 %0.637%) |
CNN | Image | Dogs vs. Cats Redux: Kernels Edition | 28 / 1,314 (상위 %0.021%) |
LSTM | Text, structrued data |
Mercari Price Suggestion Challenge | 47 / 2,382 (상위 0.02%) |
LSTM | Text | Sentiment Analysis on Movie Reviews | 22 / 861 (상위 0.026%) |
LSTM | Text | Toxic Comment Classification Challenge | 1,451 / 4,550 (상위 0.319%) |
- ML
Problem | Algorithm | Title | Ranking |
---|---|---|---|
Regression | Mercedes-Benz Greener Manufacturing | 11 / 3,831 (상위 0.003%) |
|
Classification | San Francisco Crime Classification | 61 / 2,332 (상위 0.026%) |
|
Regression | Housing Prices Competition for Kaggle Learn Users | 298 / 33,855 (상위 0.009%) |
|
Regression | Walmart Recruiting - Store Sales Forecasting | 11 / 690 (상위 %0.16%) |
|
Classification | Otto Group Product Classification Challenge | 560 / 3,511 (상위 0.159%) |
|
Classification | Medical Appointment Noshows | - | |
Regression | Bike Sharing Demand | 7 / 3,251 (상위 0.002%) |
-
- 알고리즘 사이트(프로그래머스 등) 문제 풀이
- E-mail: dataminegame@gmail.com