This is the Project for Dacon contest
핵심문제
- 결측치 채우기
1-1. 주파수 ?? 1-2. 주변 값을 통해서 1-3. src 통해서 추론? 해당 방법은 src랑 dst랑 상관관계가 너무 낮아서 좋지 않은 방법이라고 생각 src로 추론하는 건 별로 좋지 못함 dst로 dst 추론하는 것이 best 그러나 nan인 애들 추론하기가 쉽지않음
-
정규화 문제 2-1. src오 dst의 크기 차이가 너무 많이나서 Standard Scaler를 그냥 쒸우면 값이 안맞음 전반적으로 작은 값들이 다른 값임에도 불구하고 끝값으로 수렴해버리는 듯? 아니였음 그냥 값이 매우 작아서 매우 작은 아래쪽에서 차이가남
-
이상치 처리 문제 3-1. 3사분위 수까지가 1e-2값들인데 max값이 80~100이런 값이 나온다는 것이 확실히 이상치일 확률이 매우 높음 3-2. src보다 dst가 더 큰 값이 나오는 경우는 없겠지?