13.4 Probability Density Function (pdf)

절대 일어나지 않으면 0, 항상 일어나면 1로 표현하고, 위 두 가지가 아니면 0과 1사이의 값으로 일어날 가능성을 표현할 수 있고, 결과는 (적어도 관찰자가 보기에) 우연에 의해 지배되는그 무엇. 독립적으로 무수히 시행한다면 (해당사건이나오는횟수)/(전체시도횟수)로 정의할 수 있다.

우연에 의해 (확률적으로) 결정되는 사건(event)을 수(number)로 대응시킨 사상(mapping, 넓은 의미의 함수 function) 확률변수의 보통함수(일반적인 사칙연산만으로 이루어진 함수)는 새로운 확률변수가 된다. 확률변수에는 연속형(continuous)과 이산형(discrete)이있다. 확률변수는 주로 영어대문자(X, Y)로 나타내고, 많이 쓰이는 일부에 대해서는 그리스 소문자(\(\eta\), \(\epsilon\))로 나타낸다. 그리스 대문자 \(\Sigma\), \(Omega\) 등과 소문자 \(\mu\), \(\sigma\), \(\rho\), \(\theta\) 등은 상수를 나타낸다. 영어소문자(x, y)는 해당 대문자 확률변수(X, Y)의 관측치(관측값, observation value)를 나타낸다. 표본평균 \(\bar{X}\)도 확률변수이다.

연속형 확률변수 X에 대해 다음과 같은 조건을 만족하는 함수 f(x)를 확률변수 X의 확률밀도 함수(pdf)라 한다.

\[P(a < X < b) = \int_a^b f(x) dx\]

이산형의 경우에는 적분기호 대신 summation 기호(\(\Sigma\))를 사용하며, 확률질량함수(probability mass function, pmf)라 한다.

다음 조건을 만족하는 함수 F(x)를 cumulative distribution function (cdf)라 한다.

\[P(a < X < b) = F(b) - F(a)\]

평균이 \(\mu\), 분산이 \(\sigma\)인 정규분포(normal distribution)를 따르는 확률변수 X의 pdf는 다음과 같다.

\[f(x) = \frac{1}{\sqrt{2 \pi {\sigma}^2}} e^{- \frac{(x-\mu)^2}{2{\sigma}^2}}\]

이를 다음과 같이도 표현한다.

\[X \sim N(\mu, {\sigma}^2)\]