프로젝트 소개

프로젝트 주제

서울시 상권 분석 대시보드

주제 선정 목적

  • 사업의 시작은 많은 조사를 필요로 합니다. 각 지역의 상권마다 업종별 매출 차이, 주 고객층의 소비 패턴, 유동인구 수등 상당히 많고 다양한 지표를 종합적으로 고려해야 보다 안전하고 성공적인 사업을 운영할 수 있습니다.
  • 저희 팀은 사업을 시작하시려는 분들이나 이미 가게를 운영하고 계신 사장님들께서 서울시 상권의 다양한 데이터를 보다 쉽게 확인할 수 있도록 데이터 전처리 및 시각화작업을 진행하고, 누구나 쉽게 사용할 수 있는 대시보드를 제공하여 의사결정에 있어서 실질적인 도움을 드리고자 이번 주제를 기획하게 되었습니다.

기대효과

  1. 효율적인 의사결정 지원 : 다양한 지표를 시각화하여 제공함으로써, 자영업자들이 빠르고 정확하게 정보를 분석하고 합리적인 의사결정을 내릴 수 있습니다.
  2. 사업 성공률 향상 : 업종별, 지역별 매출 차이와 주 고객층의 소비 패턴 등을 고려하여 적합한 사업 전략을 세울 수 있어, 성공적인 사업 운영 가능성이 높아집니다.
  3. 시간 및 비용 절감 : 복잡한 데이터를 손쉽게 확인하고 분석할 수 있어, 자영업자들이 조사에 드는 시간과 비용을 절감할 수 있습니다.
  4. 경쟁력 강화: 상권 분석을 통해 경쟁 업체와의 차별화 전략을 수립하고, 보다 효과적인 마케팅 및 운영 전략을 실행할 수 있습니다.

참여자 정보 및 역할

안재영(팀장) : 서울시 길단위 인구 데이터 가공 및 시각화

서상민 : 2023년 서울시 추정 매출 데이터 가공 및 시각화

이승준 : 서울시 점포 관련 데이터 가공 및 시각화

좌상원 : 데이터 적재, 서울시 소득/소비 데이터 가공 및 시각화

프로젝트 상세

데이터 소스

프로젝트 구조

image

데이터 웨어하우스 구조

image

프로젝트 결과

길단위 인구 대시보드

image

해당 분기의 행정동별 성별의 길단위 인구와 서울시 전체 길단위 인구를 파악할수 있다 이를 바탕으로 어떤 점포를 열고 어느 성별을 타겟팅 할지를 선택할수 있는 데이터를 얻을수있다

image

요일별 길단위 인구를 파악하여 어느 요일에 길단위 인구가 많은지 확인할수 있다. 서울시 전체 요일별 길단위 인구를 참조하여 해당 행정동과 서울시 전체의 행정동의 길단위 인구차이를 확인할수 있다

image

10대 부터 60대까지의 행정동별 데이터를 한눈에 파악가능하게 중첩되는 그래프로 생성해 이를 바탕으로 어느 행정동에서 어떤 세대의 길단위 인구가 큰지 파악하여 점포 창업에 도움을 받을수 있다

서울시 나이대별 길단위 인구를 분기별 라인그래프형식으로 만들어 분기별 길단위 인구의 세대별 변화를 확인할수 있다

image

행정동 시간대별 길단위 인구를 파악하여 어느 시간대의 길단위 인구가 많은지 파악을 할수있다.

서울시 전체의 시간대별 길단위인구를 확인하여 서울시 길단위 인구를 파악하여 운영에 도움이 되는 정보를 얻을수 있다

소비 대시보드

image

지역별 소비 데이터를 기반으로 서울시 주민들이 어떤 지역에서 소비를 가장 많이 하는지를 알 수 있습니다.

소비 상위 지역의 다양한 분야 별 소비 분포를 알 수 있습니다. 이는 사용자로 하여금 어떤 지역에서 어떤 업종이 유리한 지를 판단할 수 있게 도와줍니다.

분기별로 시민들의 분야별 소비 변화 추이를 나타낸 그래프 입니다. 사용자는 어떠한 분야에 사람들이 소비를 많이하고, 그 분야가 성장세인지, 하락세인지를 판단하도록 도와줍니다.

점포 대시보드

image

서울시 업종별 개업,폐업수를 나타내는 그래프 하늘색은 개업수를 나타내며, 남색은 폐업수를 나타내고 있습니다. 이 그래프를 확인하여 서울시에서 어떤 업종이 개업이 많이 되고 폐업이 많이 되는지 확인할 수 있습니다

서울시 어느 지역에 많은 점포들이 분석하는 차트로 총 263000개의 매장이 있고 역삼1동, 신당동 … 이렇게 점포가 활발하게 있는 것을 확인 할 수 있습니다.

image

서울시 전체 점포수를 지도에 적용하여 보기 편하게 만들었습니다. 지도에는 서울시 행정구역의 위도 경도를 넣어서 가시화 했습니다

서울시 프랜차이즈 비중을 나타내는 그래프로 x좌표는 총 매장수 y좌표는 프랜차이즈 수 포인트 크기는 프랜차이즈 퍼센트로 만들어 보기 쉽게 만들었습니다.

추정 매출 대시보드

image

2023년 서울시의 서비스 업종 별 평균 매출 금액, 최대 매출 금액, 최소 매출 금액을 나타내었습니다. 최소 매출 금액의 경우 최대 매출 금액과 차이가 크기 때문에 logarithmic을 사용하였습니다. 대체로 최대 매출 금액과 평균 매출금액의 그래프 형태가 비슷하였으며, 평균 매출 금액이 가장 높은 것은 한식음식점(9.52B), 그 다음이 수산물판매(6.71B)이었습니다.

image

2023년 서울시의 나이에 따라 매출 금액과 매출 건수의 변동을 확인할 수 있도록 하였습니다. 나이에 따라 매출이 높은 서비스 업종을 확인할 수 있으며, 서비스 업종에 따라 고객 타겟팅을 하는데 도움이 될 수 있을 것입니다.

image

2023년 서울시 길단위 인구 테이블을 JOIN하여 길단위 인구에 따른 행정동 별 매출 금액을 나타내었습니다. 특정 몇 개의 행정동이 큰 매출 금액을 나타내었고, 가락1동의 경우(왼쪽 중앙의 연주황색 원) 길단위 인구가 타 행정동에 비해 매우 적지만 높은 매출 금액을 나타내었습니다.

기술적 개선점

데이터 적재 자동화 구현

  • 현재 분기 별로 저장된 데이터를 S3에 “직접” 적재한 뒤 사용하는 방식을 사용함
    • 해당 방법은 데이터를 하나하나 일정 기간마다 직접 최신화시켜야된다는 문제점이 있음
    • 이를 해결하기위해 데이터 파이프라인을 구축해 자동화를 기획
  • 현재 상황에서 자동화 기능 구현 방법을 탐색 및 공유 (실제로 구현 X)
    • github-action
    • 로컬 혹은 EC2에서 crontab
      • crontab : 리눅스용 작업 스케줄러로 특정 시각에 명령어를 반복 수행 가능
      • EC2 : AWS에서 제공하는 클라우드 컴퓨팅 서비스
      • crontab을 활용하면, s3에 적재하는 코드를 일정 시간마다 실행시켜 자동화할 수 있다. 이에 더해 EC2 서버 위에서 crontab을 작성한다면, 로컬이 아닌 클라우드 환경에서 본인의 컴퓨터 동작과 관계없이 crontab 코드를 지속적으로 실행할 수 있다.
    • AWS EventBridge + Lambda
      • Lambda를 이용해 파이썬 코드를 작성해 데이터를 원하는 데이터를 받아 csv파일로 처리 후 s3와 연결해 해당 데이터를 업데이트하는 기능을 구현한뒤 AWS 에서 지원하는 EventBridge를 이용해 해당 기능을 원하는 간격으로 수행하도록 설정하면 원하는 간격으로 데이터를 자동으로 가져와 처리하는 파이프라인이 구축됨

Preset 대시보드 구현

  • Preset 사용에 미숙해서 생각했던 차트를 모두 구현하지 못함
  • 그러나 데이터 부분이 더 중요하기에 데이터 적재 자동화를 우선 탐색

느낀점

  • 안재영 : 2차 프로젝트 준비하면서 어렵다는 소리를 많이들어서 걱정했는데 팀원들이 알아서 착착 잘 진행해줘서 편하게 작업했습니다
  • 서상민 : 1차 프로젝트는 웹을 제작하느라 시간이 오래 걸렸는데, 2차 프로젝트는 웹 제작 없이 대시보드만 제작이 끝이라 편한 마음으로 임할 수 있었다. 오히려 프로젝트와 관련하여 추가할 것을 생각해보는 시간을 가질 수 있어서 좋았다.
  • 이승준 : 좋은 팀원분들을 만나 빨리 작업할 수 있었으며 그만큼 좋은 결과물을 만들 수 있었다고 생각합니다. 자동화 부분을 못한것이 아쉽지만 다음 프로젝트는 자동화를 제대로 적용시켜 더욱 완벽한 프로젝트를 만들고 싶습니다
  • 좌상원 : 팀원분들 다 열정적으로 맡은 바 잘 처리해 주셔서 너무 편하고 수월한 프로젝트였습니다. 데일리 스크럼을 통해 의견 교류하고 완료한 일, 해야할 일 정리하면서 프로젝트를 진행하니 진행 방향도 명확하고, 제가 해결하지 못한 부분도 빠르게 해결되어 다시한번 정기적인 회의가 중요하다고 생각했던 프로젝트였습니다. 데이터 자동화 부분을 깔끔하게 구현하지 못한 것이 좀 아쉽긴 하네요… Airflow를 다음주에 배우는데 그걸 미리 공부해서 적용해보았다면 어땠을까 하는 아쉬움이 있습니다.