/dacon_team6

Primary LanguageJupyter Notebook

데이콘 서포터즈 '데이크루(DACrew)' 6기

'데이크루(DACrew)' 6기 신용카드 연체 예측 프로젝트

🖥️ 프로젝트 소개

데이크루는 참여자들끼리 데이터 분석을 상호 가르쳐줍니다.
우리 팀이 만든 프로젝트가 다른 이들에게 도움이 될 수 있는 프로젝트 입니다.

미리 제공된 train_csv, test_csv, submission_csv 3개의 데이터로
데이터 분석 및 추론을 진행하고, 그 과정을 설명하는 것입니다.
좋은 아이디어를 누가 가장 잘 설명하는지를 평가하게 됩니다.

*데이터를 불러오는 과정부터 예측 결과를 확인하는 부분까지의 내용을 제출해야 합니다.

🕰️ 프로젝트 기간

  • 2023년 7월 8일 10:00 ~ 2023년 8월 31일 17:59

🧑‍🤝‍🧑 맴버구성

  • 팀장 : 한준호
  • 팀원1 : 김소희

⚙️ 개발 환경

  • python3.11
  • jupyter notebook

🥇기술 스택

  • pandas
  • matplotlib
  • sklearn
  • seaborn
  • xgboost
  • lightgbm

📌 Stage 설명

Stage1 데이터 불러오기

  • 데이터불러오기
  • 데이터 살펴보기

Stage2 데이터 확인

  • 데이터프레임 정보확인
  • 결측치 처리하기
  • 전처리 데이터 저장

Stage3 모델링 기초

  • 모델링
  • 레이블 인코딩
  • 데이터 나누기
  • 모델 학습 및 평가
  • 예측 및 파일제출

Stage4 EDA

  • 종속변수 확인
  • 수치형 데이터 EDA
  • 카테고리형 데이터 EDA
  • 데이터 시각화

Stage5 Feature Engineering

  • 불필요한 변수 제거
  • 치우쳐진 데이터(Skewed Data) 처리
  • 이상치 데이터 (범주형 변수 추가)
  • 중복 데이터 처리
  • 파생변수 만들기
  • 카테고리형 변수 반환

Stage6 하이퍼 파라미터 튜닝 & 최종 모델링

  • 앙상블 모델
  • 의사결정나무/랜덤포레스트/XGBoost/LightGBM
  • 모델 성능비교
  • 하이퍼 파리미터 튜닝 비교
  • 최종 하이퍼 파라미터 적용
  • 예측 결과 저장 및 제출