본문 바로가기

통계, 신호처리, 알고리즘/통계 기초3

왜도(skewness) 왜도(skewness)란 확률 분포의 비대칭성을 나타내는 지표입니다. 값이 양수일 경우 분포가 왼쪽으로 치우쳐있고(오른쪽으로 꼬리가 긴) 값이 음수일 경우 분포가 오른쪽으로 치우쳐(왼쪽으로 꼬리가 긴) 있습니다. - 수식으로는 아래와 같이 z-score의 3승의 평균값으로 구할 수 있습니다. - 정규분포나 좌우 대칭인 분포의 왜도값은 0 혹은 0에 가까운 값을 가집니다. ♣ 실습 ♣ 파이썬 패키지인 SciPy의 stats모듈의 skew 함수를 이용하여 구하거나, 직접 함수를 만들어 구할 수 있습니다. 1) 정규 분포 데이터 생성 2) Skewness 함수 정의 3) 정의된 skewness 함수로 연산 * 정규분포의 랜덤변수를 생성하였으므로 왜도값이 0에 가까운 값을 보입니다. 4) SciPy의 skew .. 2020. 5. 18.
첨도(kurtosis) 첨도(kurtosis)란 확률 분포의 뾰족한 정도를 나타내는 척도로, 관측치들이 얼마만큼 평균에 몰려 있는가를 측정할 때 사용됩니다. 첨도값(κ, kappa)이 3에 가까우면 산포도가 정규분포에 가깝다고 할 수 있으며, 3보다 작을 경우 정규분포보다 더 완만한, 납작한 분포로 판단할 수 있으며, 첨도값이 3보다 큰 경우에는 정규분포보다 더 뾰족한 분포로 생각할 수 있습니다. (* κ=3일때 정규분포를 가지는 것을 Pearson's definition에 따름) - 수식으로는 아래와 같이 z-score의 4승의 평균값으로 구할 수 있습니다. kurtosis에서 3을 뺀 값으로, 값이 0일 때 경우 정규분포를 가지도록 하기 위해 고안됨. 본문에서는 γ2(gamma)로 표현하겠습니다. (* Fisher's de.. 2020. 4. 22.
표준화(standardization) vs 정규화(normalization) 표준화(standardization)와 정규화(normalization) 표준화(standardization)와 정규화(normalization), 많이 들어본 표현이지만 헷갈리게 사용할때가 종종 있습니다. 그래서 간략하게 정리해보고자 합니다. 먼저, 표준화(standardization)를 수행하면, 원 데이터가 정규분포상에서 어느 위치에 있는 지 알 수 있습니다. 단위가 다른 두개 이상의 데이터를 각 집단에서 상대적인 위치를 비교할때 유용하게 쓰일 수 있습니다. 변환한 표준점수(z-score)가 음수일 경우 원 데이터는 평균보다 작고, 양수일 경우 평균보다 큼을 알 수 있습니다. 다음으로, 정규화(normalization)는 원 데이터에서 최소값을 뺀 값을 최대값과 최소값의 차이로 나눠주는 작업입니다... 2020. 4. 22.