6.4 연습문제
유명한 분포들의 parameter 개수를 조사하고 표로 나타내어라.
확률밀도함수(pdf)를 적분하면 cdf (cumulative distribution function)가 된다. 그런데, 이 적분이 쉽지 않다. Gaussian quadrature 방법을 포함하여 numerical integration 방법들에 대해 조사하고 요약하라.
항암제 임상시험에서는 특정 용량에서 1/3 이상의 대상자에서 Dose Limiting Toxicity (DLT)가 나타나면 이를 (또는 이보다 한 단계 낮은 용량을) Maximum Tolerated Dose (MTD)라고 한다. 만약 어떤 약물이 특정 용량에서 DLT를 나타낼 확률이 1/3이라면 (미지의 진실을 가정한 것임), 이 용량을 투약 받은 6명의 환자 중에서 2명 이상이 DLT를 보일 확률을 구하시오. 단, 개별 환자에서 DLT가 나타날 사건은 서로 독립이라고 보며, 성별, 연령, 체중에 따른 보정 정보는 없다.
어떤 실험 자료의 결과변수는 counting data인데, 평균과 분산이 매우 유사해 보였다. 다른 정보가 없는 상황에서 어떤 분포를 가정하면 적절하겠는가?
투약 받은 환자에게 1/10,000분의 확률로 심각한 이상반응(Serious Adverse Event, SAE)이 나타난다고 가정하자. SAE 1건 이상을 95% 이상의 확률로 관찰하려면 최소 몇 명을 관찰하여야 하겠는가?
고등학생을 대상으로 한 모의고사 원점수(원래 점수, raw score)의 분포가 정규분포라 하자. 원점수를 이용하여 T 점수를 다음과 같이 정의하자. 어떤 학생이 T 점수로 80점을 받았다면 위에서부터 몇 % 안에 든다고 볼 수 있는가? 이것은 십만 명중에 몇 등 정도 했다는 것을 의미하는가?
\[\mathrm{T\;score} = \frac{\mathrm{raw\;score} - \mu_{\mathrm{raw\;score}}}{\sigma_{\mathrm{raw\;score}}} \cdot 10 + 50\]
위 문제에서 어떤 학생이 T 점수는 80점을 받았지만, 응시생 십만 명중에 1,000등을 하였다면, 위 분포는 정규분포에서 어떻게 벗어났다는 것을 의미하는가?
다음의 R script를 실행해 보면 두 칼럼이 똑같음을 알 수 있다. 왜 같은지 설명해 보시오.
cbind(-2*log(1 - (0:10)/10), qchisq((0:10)/10, 2))
cbind(1 - exp(-(0:10)/2), pchisq(0:10, 2))