데이콘 서포터즈 '데이크루(DACrew)' 6기
'데이크루(DACrew)' 6기 신용카드 연체 예측 프로젝트
🖥️ 프로젝트 소개 데이크루는 참여자들끼리 데이터 분석을 상호 가르쳐줍니다.
우리 팀이 만든 프로젝트가 다른 이들에게 도움이 될 수 있는 프로젝트 입니다.
미리 제공된 train_csv, test_csv, submission_csv 3개의 데이터로
데이터 분석 및 추론을 진행하고, 그 과정을 설명하는 것입니다.
좋은 아이디어를 누가 가장 잘 설명하는지를 평가하게 됩니다.
*데이터를 불러오는 과정부터 예측 결과를 확인하는 부분까지의 내용을 제출해야 합니다.
🕰️ 프로젝트 기간
- 2023년 7월 8일 10:00 ~ 2023년 8월 31일 17:59
🧑🤝🧑 맴버구성
- 팀장 : 한준호
- 팀원1 : 김소희
⚙️ 개발 환경
python3.11
jupyter notebook
🥇기술 스택
pandas
matplotlib
sklearn
seaborn
xgboost
lightgbm
📌 Stage 설명
Stage1 데이터 불러오기
- 데이터불러오기
- 데이터 살펴보기
Stage2 데이터 확인
- 데이터프레임 정보확인
- 결측치 처리하기
- 전처리 데이터 저장
Stage3 모델링 기초
- 모델링
- 레이블 인코딩
- 데이터 나누기
- 모델 학습 및 평가
- 예측 및 파일제출
Stage4 EDA
- 종속변수 확인
- 수치형 데이터 EDA
- 카테고리형 데이터 EDA
- 데이터 시각화
Stage5 Feature Engineering
- 불필요한 변수 제거
- 치우쳐진 데이터(Skewed Data) 처리
- 이상치 데이터 (범주형 변수 추가)
- 중복 데이터 처리
- 파생변수 만들기
- 카테고리형 변수 반환
Stage6 하이퍼 파라미터 튜닝 & 최종 모델링
- 앙상블 모델
- 의사결정나무/랜덤포레스트/XGBoost/LightGBM
- 모델 성능비교
- 하이퍼 파리미터 튜닝 비교
- 최종 하이퍼 파라미터 적용
- 예측 결과 저장 및 제출