본문 바로가기

분류 전체보기119

SciPy의 'curve_fit'을 이용한 커브 피팅 SciPy의 'curve_fit'을 이용하면 입력데이터가 예상하는 특정 함수와 유사한 추이를 보이는지를 알아볼 수 있습니다. 입력데이터의 개형을 유추할 함수가 주어져야하며, 이때 해당하는 함수의 파라미터를 추정해줍니다. ♣ 실습 ♣ 1) 먼저 'curve_fit'을 사용하기 위해 scipy.optimize에서 함수를 호출합니다. 2) 지금은 피팅할 데이터가 없으니 임의로 피팅할 데이터를 생성합니다. 여기서는 3차 다항식를 생성하고 노이즈를 추가해주었습니다. 3) 위의 데이터를 추정하기 위한 함수의 기본형을 설정해주어야 합니다. 경우에따라 함수의 기본형을 추정하기 어려울 때에는 몇번의 시행착오를 거쳐야 하기도 하며, 때로는 원하는 결과를 얻지 못할 수도 있습니다. 4) 자, 이제 커브피팅을 해봅시다. 3).. 2020. 4. 22.
첨도(kurtosis) 첨도(kurtosis)란 확률 분포의 뾰족한 정도를 나타내는 척도로, 관측치들이 얼마만큼 평균에 몰려 있는가를 측정할 때 사용됩니다. 첨도값(κ, kappa)이 3에 가까우면 산포도가 정규분포에 가깝다고 할 수 있으며, 3보다 작을 경우 정규분포보다 더 완만한, 납작한 분포로 판단할 수 있으며, 첨도값이 3보다 큰 경우에는 정규분포보다 더 뾰족한 분포로 생각할 수 있습니다. (* κ=3일때 정규분포를 가지는 것을 Pearson's definition에 따름) - 수식으로는 아래와 같이 z-score의 4승의 평균값으로 구할 수 있습니다. kurtosis에서 3을 뺀 값으로, 값이 0일 때 경우 정규분포를 가지도록 하기 위해 고안됨. 본문에서는 γ2(gamma)로 표현하겠습니다. (* Fisher's de.. 2020. 4. 22.
표준화(standardization) vs 정규화(normalization) 표준화(standardization)와 정규화(normalization) 표준화(standardization)와 정규화(normalization), 많이 들어본 표현이지만 헷갈리게 사용할때가 종종 있습니다. 그래서 간략하게 정리해보고자 합니다. 먼저, 표준화(standardization)를 수행하면, 원 데이터가 정규분포상에서 어느 위치에 있는 지 알 수 있습니다. 단위가 다른 두개 이상의 데이터를 각 집단에서 상대적인 위치를 비교할때 유용하게 쓰일 수 있습니다. 변환한 표준점수(z-score)가 음수일 경우 원 데이터는 평균보다 작고, 양수일 경우 평균보다 큼을 알 수 있습니다. 다음으로, 정규화(normalization)는 원 데이터에서 최소값을 뺀 값을 최대값과 최소값의 차이로 나눠주는 작업입니다... 2020. 4. 22.