[Numpy] ddof 란? (np.var)
numpy 에서 분산과 표준편차를 구할 때 아래와 같이 np.var()
과 np.std()
를 사용한다.
x
import numpy as np
np.var(x, ddof=1) #variance 분산
np.std(x, ddof=1) #standard deviation 표준편차
여기서 ddof 는 Degrees of Freedom 으로 자유도를 의미하고 설정해주는 것이다.
Degrees of Freedom
- 독립적인 정보의 개수
- 통계값을 계산하기 위해 자유롭게 값을 가질 수 있는 숫자의 개수
표본 개수 - 계산을 위해 사용하는 매개변수의 개수로 생각할 수 있다.
n-1 개를 알고 있다면 마지막 1개의 값은 알 수 있다 => n-1 의 자유도
ex) 10명의 학생의 시험 점수를 예로 들면, 만약 9명의 점수를 알고 평균 점수를 알고 있다면 나머지 1명의 점수를 계산을 통해 알 수 있다. 즉 표본의 개수가 n 이고, 표본 평균을 알고 있으면, 자유도는 n-1 이다.
xxxxxxxxxx
degrees of freedom = (sample size) - (number of parameters needed for calculation)
자유도 = 표본개수 - 계산을 위해 필요한 매개변수
'Data_Python' 카테고리의 다른 글
[파이썬] Most Common Words 가장 자주 사용된 단어 추출 (0) | 2022.05.25 |
---|