/Policy-to-utilize-DT-in-traditional-markets

πŸ₯ˆ Top 2 in "톡계데이터 뢄석, ν™œμš© λŒ€νšŒ(톡계청)" - λ„₯μŠ€νŠΈλ…Έλ©€ μ‹œλŒ€_μ „ν†΅μ‹œμž₯ DT ν™œμš© λ°©μ•ˆ

Primary LanguageJupyter NotebookMIT LicenseMIT

μ „ν†΅μ‹œμž₯ DT ν™œμš© λ°©μ•ˆ

πŸ₯ˆ 2021λ…„ 톡계데이터 뢄석, ν™œμš©λŒ€νšŒ 2λ“±

DTCλ₯Ό ν™œμš©ν•˜μ—¬ μ „ν†΅μ‹œμž₯을 살리기 μœ„ν•œ μ •λΆ€ μ •μ±… μ œμ‹œ
λ³΄λ„μžλ£Œ

Project Flow

주제 μ„ μ •

λ„₯μŠ€νŠΈλ…Έλ©€ μ‹œλŒ€ - μ „ν†΅μ‹œμž₯ DT ν™œμš© λ°©μ•ˆ μ°Έκ³ 

뢄석 데이터 μ„ μ •

μ „ν†΅μ‹œμž₯

  • μœ„μ˜ 데이터와 λ”λΆˆμ–΄, ν†΅κ³„μ²­μ—μ„œ μ œκ³΅ν•˜λŠ” 데이터λ₯Ό μΆ”κ°€μ μœΌλ‘œ ν™œμš©(μœ λ™μΈκ΅¬ Dataset)ν•˜μ˜€μœΌλ©°, μ΄λŠ” 곡개 λΆˆκ°€ν•˜λ©° 이둜 μΈν•œ PCA κ³Όμ •μ—μ„œ μ΅œμ’… λ°œν‘œμžλ£Œμ™€μ˜ 차이가 μžˆμŒμ„ μ°Έκ³ ν•˜μž.

Data Preprocessing

  • μ’Œν‘œκ³„ λ³€ν™˜
  • 결츑치 처리 및 보간
  • μ΄μƒμΉ˜ 처리
  • 데이터 μ •κ·œν™”

Feature Engineering

차원 μΆ•μ†Œ (PCA & MCA)

  • λ§Žμ€ Feature 수둜 μΈν•œ, 닀쀑곡선성 문제 해결을 μœ„ν•˜μ—¬ 차원 μΆ•μ†Œ 기법 적용
  • PCAλ₯Ό ν™œμš©ν•˜μ—¬ μ—°μ†ν˜• λ³€μˆ˜μ˜ 닀쀑곡선성 문제 ν•΄κ²° 및 νŒŒμƒ λ³€μˆ˜ 생성
  • MCAλ₯Ό ν™œμš©ν•˜μ—¬ λͺ…λͺ©ν˜• λ³€μˆ˜μ˜ 닀쀑곡선성 문제 ν•΄κ²° 및 νŒŒμƒ λ³€μˆ˜ 생성

μ „ν†΅μ‹œμž₯1

Clustering (KMeans)

  • DTC(Drive Througth Center) μœ„μΉ˜ μ„ μ • 문제 및 μƒν’ˆ μΆ”μ²œμ„ μ μš©ν•˜κΈ° μœ„ν•œ μš΄μ˜μœ„κΈ° μ‹œμž₯ ꡰ집을 ν΄λŸ¬μŠ€ν„°λ§μ„ ν™œμš©ν•˜μ—¬ μ„ μ •
  • KMeans, Hierarchical, DBSCAN, GMM 적용 ν›„ 싀루엣 κ³„μˆ˜λ₯Ό ν™œμš©ν•˜μ—¬ μ΅œμ’… KMeans 기법 선택
  • 싀루엣 κ³„μˆ˜μ˜ 뢄산을 κ³ λ €ν•˜μ—¬ KMeans의 3개의 ꡰ집 μ„ μ • μ „ν†΅μ‹œμž₯2
  • 3개의 ꡰ집 κ°€μš΄λ° κ°€μž₯ μœ„κΈ° μ‹œμž₯을 μ‹œκ°ν™” ν•œ ν›„ 이λ₯Ό λ°”νƒ•μœΌλ‘œ μ΅œμ’… ꡰ집 μ„ μ •

Item

DTC 졜적 μž…μ§€ μ„ μ •

  • κ³΅κ³΅μ‹œμ„€μ„ DTC ν›„λ³΄κ΅°μœΌλ‘œ μ„ μ •
  • μ„ μ •λœ κ³΅κ³΅μ‹œμ„€ 후보ꡰ 쀑 κ°€μž₯ 쒋은 μž…μ§€λ₯Ό μ„ μ •ν•˜λŠ” 방법인 P-Median μ•Œκ³ λ¦¬μ¦˜μ„ ν™œμš©
  • 좔가적인 μ œμ•½μ‚¬ν•­μ„ ν™œμš©ν•˜μ—¬ P-Median을 Heuristicν•˜κ²Œ 적용.
  • μœ λ™μΈκ΅¬μ™€ 편의점수의 κ°•ν•œ 상관관계λ₯Ό ν™•μΈν•œ ν›„, μœ λ™μΈκ΅¬ 데이터λ₯Ό 편의점 수 λ°μ΄ν„°λ‘œ λŒ€μ²΄ν•˜μ—¬ ν™œμš©
  • P-Median: μž…μ§€ 후보지 쀑 μˆ˜μš”μ§€μ™€μ˜ 거리λ₯Ό κ³„μ‚°ν•˜μ—¬ P개의 μ΅œμ’… μž…μ§€ μ„ μ •.
  • 이에 μΆ”κ°€μ μœΌλ‘œ 볡수처리, λΉˆλ„μˆ˜ μ œμ•½μ„ μΆ”κ°€ν•˜μ—¬ μ΅œμ’… 3~4개의 후보ꡰ μ„ μ •.
  • μ΅œμ’… 후보ꡰ에 μΆ”κ°€ μ œμ•½μ‚¬ν•­μ„ λ”ν•˜μ—¬ μ΅œμ’… μž…μ§€λ₯Ό μ„ μ •. μ „ν†΅μ‹œμž₯4

DTC μƒν’ˆ ν’ˆλͺ© μΆ”μ²œ

  • "온라인 인기 μœ ν†΅ μƒν’ˆ == DTC μƒν’ˆ ν’ˆλͺ© μΆ”μ²œ λŒ€μƒ" 이라고 νŒλ‹¨.
  • 농산물, μˆ˜μ‚°λ¬Ό, 좕산물에 λŒ€ν•œ 온라인 μœ ν†΅ μƒν’ˆμ„ 인기순으둜 데이터 크둀링
  • λΉˆλ„μˆ˜λ₯Ό λ°”νƒ•μœΌλ‘œ WordCloudλ₯Ό ν†΅ν•œ μ‹œκ°ν™” 및 μΆ”μ²œ. μ „ν†΅μ‹œμž₯3

κΈ°λŒ€νš¨κ³Ό

  • λ‹€μ–‘ν•œ 경제적 νŒŒκΈ‰νš¨κ³Ό 창좜
  • μ†ŒλΉ„μžλ“€μ˜ νŽΈμ˜μ„± ν™•λŒ€
  • μ „ν†΅μ‹œμž₯의 디지털 μ „ν™˜μ— λŒ€ν•œ μ •λΆ€ μ •μ±…μ˜ κ°€μ΄λ“œλΌμΈ 제곡

Structure Directory

+- λ„₯μŠ€νŠΈλ…Έλ©€ μ‹œλŒ€ - μ „ν†΅μ‹œμž₯ DT ν™œμš©λ°©μ•ˆ.pdf
+- pmedian
|   +- README.md
|   +- pmedian.py
|   +- pmedian.ipynb
|   +- requirements.txt
+- wordcloud
|   +- μž‘μ„±μ˜ˆμ •
+- preprocess
|   +- preprocess.ipynb
|   +- pca.ipynb
|   +- clustering.ipynb
+- EDA
|   +- market_data.ipynb
|   +- reason_to_save_traditional_market.ipynb
|   +- change_coordinate.ipynb
+- data
    ...

Contributor