-
#4 누적 분포 함수와 확률 밀도 함수는 무엇인가요?통계학 2025. 3. 17. 21:55
누적 분포 함수(CDF)와 확률 밀도 함수(PDF) 개념 정리
1. 확률 밀도 함수(Probability Density Function, PDF)
확률 밀도 함수(PDF)는 연속 확률 변수의 특정 값 근처에서 확률이 어떻게 분포하는지 나타내는 함수입니다.
(1) 정의
확률 변수 X가 연속적인 경우, **확률 밀도 함수 f(x)**는 다음 성질을 만족합니다.
1. 함수의 모든 값이 0 이상
$$ f(x) \geq 0, \quad \forall x$$
2. 전체 확률의 합이 1
$$\int_{-\infty}^{\infty} f(x) \,dx = 1$$
3. 특정 구간에서 확률 계산 가능
확률 변수 X가 구간 a \leq X \leq b에 존재할 확률은 다음과 같이 계산됩니다.
$$P(a \leq X \leq b) = \int_{a}^{b} f(x) \,dx$$
즉, PDF는 특정 값에서의 확률을 직접 구할 수 없고, 특정 구간에 대한 확률을 적분하여 계산해야 합니다.
(2) 예제 - 정규 분포(Normal Distribution)의 PDF
정규 분포(평균 \mu, 분산 \sigma^2)의 확률 밀도 함수는 다음과 같습니다.
$$f(x) = \frac{1}{\sqrt{2\pi\sigma^2}} e^{-\frac{(x - \mu)^2}{2\sigma^2}}$$
이 함수는 종 모양의 곡선을 그리며, 평균 \mu 부근에서 확률이 높고 극단적인 값에서는 확률이 낮습니다.
2. 누적 분포 함수(Cumulative Distribution Function, CDF)
누적 분포 함수(CDF)는 확률 변수 X가 특정 값 이하일 확률을 나타내는 함수입니다.
(1) 정의
누적 분포 함수 F(x)는 확률 밀도 함수 f(x)를 적분하여 정의됩니다.
$$F(x) = P(X \leq x) = \int_{-\infty}^{x} f(t) \,dt$$
즉, x보다 작은 값에서 확률이 얼마나 누적되었는지를 나타냅니다.
(2) 성질
1. CDF는 0에서 1까지 증가하는 함수
$$0 \leq F(x) \leq 1$$
2. 연속 확률 변수에서는 미분하면 PDF가 됨
$$f(x) = \frac{d}{dx} F(x)$$
3. 확률 구간 계산 가능
$$P(a \leq X \leq b) = F(b) - F(a)$$
(3) 예제 - 정규 분포의 CDF
정규 분포의 누적 분포 함수는 다음과 같이 정의됩니다.
$$F(x) = \frac{1}{\sqrt{2\pi\sigma^2}} \int_{-\infty}^{x} e^{-\frac{(t - \mu)^2}{2\sigma^2}} dt$$
이 함수는 적분이 어렵기 때문에 일반적으로 **정규분포표(표준 정규 분포 표)**를 이용하여 값을 찾습니다.
3. 확률 밀도 함수(PDF)와 누적 분포 함수(CDF)의 관계
• PDF는 확률이 어떻게 분포하는지 나타내는 함수.
• CDF는 특정 값 이하의 누적 확률을 나타내는 함수.
• PDF를 적분하면 CDF가 되고, CDF를 미분하면 PDF가 됨.
수식으로 표현하면 다음과 같습니다.
$$F(x) = \int_{-\infty}^{x} f(t) \,dt$$
$$f(x) = \frac{d}{dx} F(x)$$
4. 예제 - 균등 분포(Uniform Distribution, U(a,b))
(1) 확률 밀도 함수(PDF)
균등 분포 U(a, b)의 경우, 확률 밀도 함수는 다음과 같습니다.
$$f(x) = \begin{cases} \frac{1}{b-a}, & a \leq x \leq b \\ 0, & \text{otherwise} \end{cases}$$
(2) 누적 분포 함수(CDF)
누적 분포 함수는 PDF를 적분하여 구할 수 있습니다.
$$F(x) = \begin{cases} 0, & x < a \\ \frac{x - a}{b - a}, & a \leq x \leq b \\ 1, & x > b \end{cases}$$
즉, 균등 분포에서는 특정 값까지의 누적 확률이 선형적으로 증가합니다.
5. 결론
1. 확률 밀도 함수(PDF): 특정 값에서 확률이 얼마나 집중되어 있는지를 나타내는 함수.
• 특정 값의 확률은 의미가 없으며, 특정 구간의 확률을 적분으로 계산해야 함.
2. 누적 분포 함수(CDF): 특정 값 이하의 누적 확률을 나타내는 함수.
3. PDF와 CDF의 관계
• PDF를 적분하면 CDF가 되고, CDF를 미분하면 PDF가 됨.
• 정규 분포, 균등 분포 등 다양한 확률 분포에서 활용됨.
'통계학' 카테고리의 다른 글
#3 확률 모형과 확률 변수는 무엇인가요? (0) 2025.03.17 #2 샘플링(Sampling)과 리샘플링(Resampling)이 무엇이고 리샘플링의 장점은 어떤게 있을까요? (0) 2025.03.17 #1 고유값(Eigen value)와 고유 벡터(Eigen vecotr)이 무엇이고 왜 중요한가요? (0) 2025.03.17