ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • #4 누적 분포 함수와 확률 밀도 함수는 무엇인가요?
    통계학 2025. 3. 17. 21:55

    누적 분포 함수(CDF)와 확률 밀도 함수(PDF) 개념 정리

     


    1. 확률 밀도 함수(Probability Density Function, PDF)

     

    확률 밀도 함수(PDF)는 연속 확률 변수의 특정 값 근처에서 확률이 어떻게 분포하는지 나타내는 함수입니다.

     

    (1) 정의

     

    확률 변수 X가 연속적인 경우, **확률 밀도 함수 f(x)**는 다음 성질을 만족합니다.

    1. 함수의 모든 값이 0 이상

    $$ f(x) \geq 0, \quad \forall x$$

     

    2. 전체 확률의 합이 1

    $$\int_{-\infty}^{\infty} f(x) \,dx = 1$$

     

    3. 특정 구간에서 확률 계산 가능

    확률 변수 X가 구간 a \leq X \leq b에 존재할 확률은 다음과 같이 계산됩니다.

    $$P(a \leq X \leq b) = \int_{a}^{b} f(x) \,dx$$

     

    즉, PDF는 특정 값에서의 확률을 직접 구할 수 없고, 특정 구간에 대한 확률을 적분하여 계산해야 합니다.

     

    (2) 예제 - 정규 분포(Normal Distribution)의 PDF

     

    정규 분포(평균 \mu, 분산 \sigma^2)의 확률 밀도 함수는 다음과 같습니다.

     

    $$f(x) = \frac{1}{\sqrt{2\pi\sigma^2}} e^{-\frac{(x - \mu)^2}{2\sigma^2}}$$

     

    이 함수는 종 모양의 곡선을 그리며, 평균 \mu 부근에서 확률이 높고 극단적인 값에서는 확률이 낮습니다.

     


    2. 누적 분포 함수(Cumulative Distribution Function, CDF)

     

    누적 분포 함수(CDF)는 확률 변수 X가 특정 값 이하일 확률을 나타내는 함수입니다.

     

    (1) 정의

     

    누적 분포 함수 F(x)는 확률 밀도 함수 f(x)를 적분하여 정의됩니다.

     

    $$F(x) = P(X \leq x) = \int_{-\infty}^{x} f(t) \,dt$$

     

    즉, x보다 작은 값에서 확률이 얼마나 누적되었는지를 나타냅니다.

     

    (2) 성질

    1. CDF는 0에서 1까지 증가하는 함수

    $$0 \leq F(x) \leq 1$$

    2. 연속 확률 변수에서는 미분하면 PDF가 됨

    $$f(x) = \frac{d}{dx} F(x)$$

    3. 확률 구간 계산 가능

    $$P(a \leq X \leq b) = F(b) - F(a)$$

     

    (3) 예제 - 정규 분포의 CDF

     

    정규 분포의 누적 분포 함수는 다음과 같이 정의됩니다.

     

    $$F(x) = \frac{1}{\sqrt{2\pi\sigma^2}} \int_{-\infty}^{x} e^{-\frac{(t - \mu)^2}{2\sigma^2}} dt$$

     

    이 함수는 적분이 어렵기 때문에 일반적으로 **정규분포표(표준 정규 분포 표)**를 이용하여 값을 찾습니다.

     


    3. 확률 밀도 함수(PDF)와 누적 분포 함수(CDF)의 관계

    PDF는 확률이 어떻게 분포하는지 나타내는 함수.

    CDF는 특정 값 이하의 누적 확률을 나타내는 함수.

    PDF를 적분하면 CDF가 되고, CDF를 미분하면 PDF가 됨.

     

    수식으로 표현하면 다음과 같습니다.

     

    $$F(x) = \int_{-\infty}^{x} f(t) \,dt$$

     

    $$f(x) = \frac{d}{dx} F(x)$$

     


    4. 예제 - 균등 분포(Uniform Distribution, U(a,b))

     

    (1) 확률 밀도 함수(PDF)

     

    균등 분포 U(a, b)의 경우, 확률 밀도 함수는 다음과 같습니다.

     

    $$f(x) = \begin{cases} \frac{1}{b-a}, & a \leq x \leq b \\ 0, & \text{otherwise} \end{cases}$$

     

    (2) 누적 분포 함수(CDF)

     

    누적 분포 함수는 PDF를 적분하여 구할 수 있습니다.

     

    $$F(x) = \begin{cases} 0, & x < a \\ \frac{x - a}{b - a}, & a \leq x \leq b \\ 1, & x > b \end{cases}$$

     

    즉, 균등 분포에서는 특정 값까지의 누적 확률이 선형적으로 증가합니다.

     


    5. 결론

    1. 확률 밀도 함수(PDF): 특정 값에서 확률이 얼마나 집중되어 있는지를 나타내는 함수.

    특정 값의 확률은 의미가 없으며, 특정 구간의 확률을 적분으로 계산해야 함.

    2. 누적 분포 함수(CDF): 특정 값 이하의 누적 확률을 나타내는 함수.

    3. PDF와 CDF의 관계

    PDF를 적분하면 CDF가 되고, CDF를 미분하면 PDF가 됨.

    정규 분포, 균등 분포 등 다양한 확률 분포에서 활용됨.

     


     

Designed by Tistory.