이상치에 민감한 기법과, 이상치 영향을 줄이는 기법 정리스케일링은 피처(열)별 수치 범위를 맞추는 작업이고, 정규화는 샘플(행)별 벡터의 크기를 1로 맞추는 작업이다. 어떤 기법은 이상치에 민감하고, 어떤 기법은 비교적 둔감하다. 1) 이상치에 민감한 기법StandardScaler평균을 기준점으로 잡고 표준편차로 나누어 표준화하는 방식이다.z = (x - μ) / σ여기서 μ는 평균, σ는 표준편차이다. 평균과 표준편차는 극단값의 영향을 크게 받는다. 데이터에 1000 같은 큰 값이 하나 섞이면 평균과 표준편차가 끌려 올라가고, 정상 구간(예: 10~15)은 z-스케일에서 서로 바싹 붙어버린다. 결국 정상 구간의 미세한 차이가 뭉개지는 문제가 생긴다. 실전에서는 먼저 이상치 유무를 확인하고, 필요하면 클..