예비 카페 창업자 대상으로 서울시 상권 분석과 카페 프랜차이즈 예상 매출 시뮬레이션 기능을 제공해 복잡한 과정없이 손쉽게 카페 창업 정보를 제공하고자 서비스를 개발하였습니다.
- 팀장 : 조현우
- 팀원 : 김다인
- 깃주소
- 이메일
- 팀원 : 김신영
- 팀원 : 서재화
- 팀원 : 신시원
- 깃주소
- 이메일
- 팀원 : 이동재
- 깃주소
- 이메일
- 서울 열린데이터 광장
- 공정거래위원회
- 공정거래 위원회 정보공개서 : 프랜차이즈 브랜드 별 창업 및 유지비 산출에 활용 (https://franchise.ftc.go.kr/mnu/00013/program/userRqst/list.do?searchCondition=&searchKeyword=&column=brd&selUpjong=21&selIndus=L1&pageUnit=10&pageIndex=1)
- 네이버 부동산
- 크롤링을 통해 상가 매물 정보 조회 및 임대료 계산
- 행정 구역 구분
- 행정 구역 폴리곤 데이터 (https://github.com/vuski/admdongkor)
창업 시 지정한 위치를 기반으로 카페의 매출을 예측하는 랜덤포레스트 회귀 모델 생성 선형 회귀 모델에서 모델의 성능이 좋지 못했고, 비선형 모델 중에서 많이 사용하는 랜덤포레스트 모델을 선택
- 랜덤포레스트 모델 특성 상 스케일링이 필요하지 않아 따로 스케일링 하지 않음
- 변수 중요도를 통해 PCA 등의 방법을 사용하지 않고 변수 선택
- 크롤링을 통해 카페 위치 정보, 브랜드 등을 확보 후 해당 카페의 예상 매출을 바탕으로 학습을 진행
- 선택한 위치 주변의 정보를 반영하기 위해 500m 이내의 시설들의 수와 최단 거리를 받고 거리의 경우 역수를 취함 (주변에 해당 시설이 없을 때 최단 거리에 대한 영향을 줄이기 위해)
- 500m 내의 상권의 면적을 바탕으로 주변의 매출을 계산하여 사용
- 결측치가 없는 데이터는 제외하고 학습
- 이상치의 경우 사분위수 방법을 사용하여 Q1 - 1.5IQR과 Q3 + 1.5IQR 사이에 없는 값들을 제거
- 주변의 매출, 시간대, 요일, 연령대 별 매출 비율, 집객 시설의 수, 집객 시설의 최단 거리 등을 바탕으로 학습
- train data와 test data를 7:3 비율로 split
- 변수 중요도를 통해 변수 선택 (집객 시설 중 유치원 제외, 매출 건 수 등 모델에서 제외)
- 최종 모델 R2 0.975
- 종속 변수로 사용한 카페 당 매출이 추정치이기 때문에 발생하는 한계 (데이터의 부족 문제)
- 일정의 촉박함으로 인한 하이퍼패러미터 튜닝 및 주변 시설 반영 거리 설정에 대한 근거 부족 (반영 거리는 200M와 500M만 진행)
시간에 따라 변화하는 손님 객체 상태를 위치, 회전, 스케일, 머터리얼 4가지를 기준으로 각각의 key frame을 정의했습니다. 이를 바탕으로 보간 기법을 활용해 시간에 따라 자연스러운 움직임을 구현하였습니다.
특정 좌표 반경 500m 내 주변 편의시설 리스트를 지도 데이터로부터 받아와 관리합니다. 타일 매니저를 통해 사용자가 직접 추가 혹은 삭제된 주변 편의시설 정보를 현재 날짜와 함께 시뮬레이션 예측 결과에 반영할 수 있습니다.
renderer clock과 동기화한 날짜 시스템, 캐릭터 위치 보간을 사용하여 그래픽스 시뮬레이션 내의 날짜와 사람의 움직임이 일치하도록 개발하였습니다. 이로 인해 delta time의 배수만큼 애니메이션 배속을 제공할 수 있으며, delta time의 생략만큼 애니메이션 생략이 가능합니다.
수많은 3D 객체를 생성하는데 있어서 매번 3D 모델 데이터를 로드하지 않고, Asset Manager 내에서 이를 관리하여 생성이 필요한 때 복사본을 제공하는 방법을 채택했습니다. 또한 객체 삭제 시 material과 geometry를 dispose하여 메모리 누수를 방지했습니다.
# 선정 근거
무턱대고 창업을 해서 망하는 일이 없도록 경고의 의미로 선정하게 됐다.
# 데이터
서울시 열린 데이터 광장에서 3개월마다 영업 신고 데이터를 분석하여 개업 대비 폐업률을 계산했다.
# 선정 근거
요기요 사장님의 개인 경험과 국내 논문을 확인한 결과, 해당 상권에서 분위기를 파악하는 것이 중요하다는 사실을 확인하고, 집객 시설 등을 고려하여 선택하게 되었다.
# 데이터
서울시 열린 데이터 광장에서 제공되는 데이터의 부정확성으로부터 대표적인 집객 시설들을 크롤링하여 상권별(geojson)로 나눈 후 처리했다.