7.12 연습문제
현재 우리가 실시하는 귀무 가설 기각 시에 대립 가설을 채택하는 paradigm은 기본적으로 Neyman-Pearson의 주장에 근거하고 있다. 이에 대한 Fisher의 의견과 두 진영 간의 논쟁을 조사하여 요약하시오.
현재 유의수준(\(\alpha\))은 0.05 (5%)를 사용하는 것이 일반적이다. 유의수준을 0.05가 아닌 다른 값을 쓰는 예를 조사해 보시오.
p-value로 결정(decision based on p-value)하는 것을 비판하는 자료들을 찾아서 정리해 보시오.
다음과 같이 정규분포를 따를 것이라고 추측되는 10개의 관측값이 있다.
x = c(8.75, 10.37, 8.33, 13.19, 10.66, 8.36, 10.97, 11.48, 11.15, 9.39)
- 만약 위의 자료가 평균=8, 표준편차=1인 정규분포에서 왔다고 가정했을 때 likelihood를 구하시오.
- 만약 위의 자료가 평균=9, 표준편차=1.5인 정규분포에서 왔다고 가정했을 때 likelihood를 구하시오.
- 위의 두 경우에 어느 쪽 likelihood가 더 큰가?
- 다음의 R script로 likelihood profile을 관찰 하여라.
fy = function(mu, sigma) -log(prod(dnorm(x, mean=mu, sd=sigma))) # -log likelihood
nPoint = 101
Mu = seq(8, 12, length.out=nPoint)
Sig = seq(1, 3, length.out=nPoint)
mLL = matrix(NA, nrow=nPoint, ncol=nPoint)
for (i in 1:nPoint) for (j in 1:nPoint) mLL[i, j] = fy(Mu[i], Sig[j])
contour(Mu, Sig, mLL)
persp(Mu, Sig, mLL, theta=30)
require(rgl) # install this package first if you don't have.
persp3d(Mu, Sig, mLL, col="lightblue", alpha=0.5)
- 만약 sigma를 2로 고정하고, mu를 변화시켜 가면서 본다면 어떤 graph가 되는지 보시오. 참고로 위의 mLL matrix의 51번째 열이 sigma=2인 경우이다.
plot(Mu, mLL[, 51], type="l")
- 다음의 R script를 이용하여 maximum likelihood 값과, 그때의 mean과 sd를 구하시오. 또한 standard error를 얼마로 추정할 수 있는지 알아 보시오.
fx = function(Theta) -log(prod(dnorm(x, mean=Theta[1], sd=Theta[2])))
r1 = optim(c(8, 1), fx, method="BFGS", hessian=T) ; r1
r1$par # point estimate
r1$value # -log likelihood
exp(-r1$value) # likelihood
sqrt(diag(solve(r1$hessian))) # standard error
- 다음의 R script를 이용하여 위 결과와 유사한지 확인 하시오.
require(MASS)
fitdistr(x, dnorm, list(mean=mean(x), sd=sd(x)))
- \(y = f(x) + \epsilon\)인 모형에서 \(\epsilon\)을 평균이 0이고, 분산이 \(\sigma^2\)인 정규분포로 가정하자. f(x)는 확률변수를 포함하지 않은 arbitrary function일 수 있는데, \(f(x) = \frac{\beta_0 \cdot x}{\beta_1 + x}\)인 비선형 모형을 예로 생각하자. 이때, \(\overrightarrow{\theta} = (\beta_0, \beta_1, \sigma^2)\) parameter를 MLE로 추정할 수 있는가?