반응형
표준화(standardization)와 정규화(normalization)
표준화(standardization)와 정규화(normalization), 많이 들어본 표현이지만 헷갈리게 사용할때가 종종 있습니다.
그래서 간략하게 정리해보고자 합니다.
먼저, 표준화(standardization)를 수행하면, 원 데이터가 정규분포상에서 어느 위치에 있는 지 알 수 있습니다. 단위가 다른 두개 이상의 데이터를 각 집단에서 상대적인 위치를 비교할때 유용하게 쓰일 수 있습니다. 변환한 표준점수(z-score)가 음수일 경우 원 데이터는 평균보다 작고, 양수일 경우 평균보다 큼을 알 수 있습니다.
다음으로, 정규화(normalization)는 원 데이터에서 최소값을 뺀 값을 최대값과 최소값의 차이로 나눠주는 작업입니다. Min-max feature scaling, unity-based normalization이라고도 불립니다. 표준화를 수행하게 되면 결과 값은 [0, 1] 사이의 값으로 변환됩니다.
<Reference>
- https://en.wikipedia.org/wiki/Normalization_(statistics)
- https://en.wikipedia.org/wiki/Standard_score
반응형
'통계, 신호처리, 알고리즘 > 통계 기초' 카테고리의 다른 글
왜도(skewness) (0) | 2020.05.18 |
---|---|
첨도(kurtosis) (0) | 2020.04.22 |