/db_pjt

가을학기 db project

Primary LanguageJupyter Notebook


데이터베이스 프로젝트

위기탈출 헬조선!


ver 1.04

상관분석, 회귀분석 돌리는중!

데이터 연관잡기

종속변수 독립변수
범죄율 데이터 외국인 인구수 비율, 자살율, 교통사고사망 및 부상, cctv수, 세금데이터
전체 인구수 데이터 범죄율, 외국인 인구수 비율, 자살율, 교통사고 사망, cctv수, 세금데이터
세금 데이터 범죄율, 전체 인구수, 자살율, 교통사고 사망 및 부상, cctv수

ver 1.03

범죄율과 엮을 수 있어보이는 데이터셋을 폭넓게 수집함

  1. 유흥주점 데이터
  2. 자살율
  3. 경찰 공무원 현원
  4. 전국 cctv 표준 데이터
  5. 교통사고 부상자 및 사망자
  6. 세금 데이터
  7. 인구수

ver 1.02

구하려는 수치 수식
지역별 범죄율 범죄 발생건수 / 인구수
지역별 교통사고율 교통사고 발생건수 / 인구수
지역별 종합 사고율 범죄율 + 교통사고율
지역의 소득순위 세금 총합 / 인구수 (이 수치를 바탕으로 순위매김)
지역의 범죄율 순위 범죄율의 순위
input output
연도, 도시이름 연도, 도시이름, 세금, 범죄 발생건수, 인구수, 범죄율 (범죄합/인구수)

ex

<input>
2016, 서울

<output> (JasonForm)
{
    "status": 200,
    "message": "데이터베이스 조회 성공",
    "data": {
        "year": 2016,
        "city": "서울",
        "event": 1950,
        "population": 9805506,
        "crimeRate": 0.000198867860567318
    }
}

ver 1.01

*프로젝트의 진행방향을 틀기로함

지역별 소득수준에 따른 발생 범죄 종류 차이로 방향을 틀음. 데이터를 더 수집해 보고, 범죄종류차이 뿐만아니라 더 연관된 데이터가 존재하면, 추가하기로함.

+지역별 세금 데이터를 추가함 (지역별 소득수준을 알고, 그에대한 범죄율이 연관성이 있는지)


ver 1.00

  1. 현재 우리가 봉착한 문제에 대한 issue 확인바람.

앞으로의 진행 할 계획

  1. 현재 우리가 사용할 수 있는 구체적인 데이터 셋 2개를 구함. 아래와 같음.

​ 1) 지역별 범죄 현황 데이터셋 ​ 2) 지역별 교통사고 사망 데이터셋

이 데이터들을 예전에 찾은 마부작침 범죄여지도처럼 보여준다. 뭔가 데이터셋을 계산해서 확률을 보여주는게 아니고, 지역별로 누르면 그 데이터셋에 해당하는 통계를 그대로 보여준다. 범죄여지도에서 지역을 누르면 아래에 통계 표들이 나오는것 처럼.

이 단계가 완료 되면, 두 데이터셋에 연관되는 데이터셋을 더 찾아 위험지역을 구별하는데 신뢰도를 올릴 계획이다.