Chapter 8 두 군의 비교 (Comparison of Two Groups)
두 군의 비교는 여러 군 비교의 특별한 경우이다. 따라서, 여러 군을 비교하는 경우를 먼저 설명하면, 따로 두 군 비교를 할 필요가 없으나, 사용 빈도나 중요도를 고려하여 따로 설명한다.
즉, 선형회귀에서 x 변수(독립 변수, 설명 변수)의 값을 0과 1로 놓고 선형회귀를 하면 두 군을 비교하는 것과 같다.
또한, 두 군이지만 분산 분석을 실시하면 independent two-group t-test와 같은 결과를 얻을 수 있다.
여러 군의 비율 비교는 카이 제곱 검정을 이용할 수 있으며, 이것의 특수한 형태가 두 군의 비율 비교이다.
여기에서 비율은 영어로 proportion으로, 역시 비율(또는 비)로 주로 번역되는 ratio와 혼동을 피하기 위해 번역어로는 분율이 더 정확하나, 많은 사람들이 그대로 비율이라고 쓰기 때문에, 혼동이 되지 않는다면 분율이라는 용어 대신 비율이라는 용어를 썼다. 하지만, 독자는 proportion인지 ratio인지 잘 구분해서 봐야 한다.
평균은 y 변수가 연속형/정량형일 때 주로 사용하며, 분율은 한 개인/관측치는 0 또는 1로만 나타나는 경우에 사용한다.
결과변수(y 값)의 다른 형태로는 생존분석(survival analysis)에서 쓰는 time-to-event가 있으나, 이 장에서 다루지 않고, 생존분석에서 다룬다.