/BIO-PREDICTION

Primary LanguageJupyter Notebook

This is the Project for Dacon contest

핵심문제

  1. 결측치 채우기

1-1. 주파수 ?? 1-2. 주변 값을 통해서 1-3. src 통해서 추론? 해당 방법은 src랑 dst랑 상관관계가 너무 낮아서 좋지 않은 방법이라고 생각 src로 추론하는 건 별로 좋지 못함 dst로 dst 추론하는 것이 best 그러나 nan인 애들 추론하기가 쉽지않음

  1. 정규화 문제 2-1. src오 dst의 크기 차이가 너무 많이나서 Standard Scaler를 그냥 쒸우면 값이 안맞음 전반적으로 작은 값들이 다른 값임에도 불구하고 끝값으로 수렴해버리는 듯? 아니였음 그냥 값이 매우 작아서 매우 작은 아래쪽에서 차이가남

  2. 이상치 처리 문제 3-1. 3사분위 수까지가 1e-2값들인데 max값이 80~100이런 값이 나온다는 것이 확실히 이상치일 확률이 매우 높음 3-2. src보다 dst가 더 큰 값이 나오는 경우는 없겠지?