/Korean_house_price_analysis

hadoop spark를 이용한 10년 간 전국 집값 분석

Primary LanguagePython

BigDataProgramming

전국 부동산 10년간 거래내역을 API를 통해 불러오고 시/군/구 별로 각 해의 상승률과 10년 사이의 가장 많은 상승률을 기록한 시/군/구를 csv파일로 나타내려합니다.

tool은 spark를 사용할 예정입니다.

REST API를 이용하여 데이터셋을 모았고 인증키 문제로 인하여 하루에 3달치 씩 약 한달 간 2012년부터 2021년 데이터셋을 모았습니다. spark 분석을 활용하여 각각의 연도별로 top 10, 10년동안의 집값 상승 top 10, 10년 동안 전국 전체 집 값 데이터를 분석해 top 50을 나타내 보았습니다.