7.4 모분산의 추정

모분산은 앞에서 정의한 표본분산(\(S^2\))으로 점추정한다. 그러면, 역시 앞의 3가지 성질을 모두 가진다.

최대우도추정(maximum likelihood estimation, MLE)에 의하면 모분산은 다음과 같이 추정한다.

\(\hat{\sigma^2} = \sum \frac{(X_i - \mu)^2}{n}\)

이 경우 불편성의 특징이 사라지게 된다. 표본크기(n)가 크다면 큰 문제가 되지는 않으며, 복잡한 modeling and simulation에서는 MLE도 많이 사용한다.

신뢰구간 추정은 다음과 같이 카이제곱 분포를 이용할 수 있다.

\(\left( \frac{(n - 1)S^2}{\chi^2(n - 1, \alpha/2)} , \frac{(n - 1)S^2}{\chi^2(n - 1, 1 - \alpha/2)} \right)\)

R에서는 qchisq()사용한다.

[예제 7-5] 표준정규분포를 따르는 난수 20개를 발생시키고, 분산의 95% 신뢰구간을 구하시오.

n = 20
alpha = 0.05
x = rnorm(n)
S2 = var(x)
ci = (n - 1)*S2 / c(qchisq(1 - alpha/2, n - 1), qchisq(alpha/2, n - 1)) ; ci
[1] 0.461950 1.703936

위는 비대칭 신뢰구간이다.