[통계학] 평균과 분산 (Expected Value , Variance Value)

2021. 2. 9. 23:42지식/수학

728x90
평균(기댓값) [Expected Value] : 확률 변수의 기댓값.
  1.   E(X) = ∑ x * f(x)
  2.   μ (그리스 문자로 표기하며 발음은 "뮤"이다.)

▶ 위에서 설명했다시피 통계학에서 (기본) 평균은 확률 변수의 기댓값이다.

여기서부터 막히는데 확률변수가 뭐냐? 예를 들어서 보면 쉽다.

동전 던지기를 3번 할 때, 앞면이 나올 확률 변수는 X는

{0, 1 ,2 ,3}이다. 말이 어렵지 그냥 앞면이 나오는 횟수가 몇 회냐 이게

확률 변수 "X"이다.

 

그럼 위식 "∑ x * f(x)" 은 무엇이냐.

f(x)를 확률 함수라고 부르는데 그냥 확률 변수 x가 나올 확률이다.

차근차근 생각해보면, 자 동전 던지기를 3번 했을 때 앞면이 나오는 횟수의

기댓값이 얼마인지 보자

 

우선 동전 던지기 3번 했을 때의 총경우의 수는 몇 개인가?

각 동전 별로 앞/뒤가 있으니까 2X2X2 = 8 개의 경우를 갖는다.

 

그렇다면 앞면이 0개 나올 경우의 수는

전체 뒷면이 나올 경우 즉 1번의 경우가 있다

그러면 확률은 1/8이다. 이렇게 순서대로 적어보면

 

앞면이 총 0개 나올 확률 × 확률 변수 = 1/8 × 0 = 0

앞면이 총 1개 나올 확률 × 확률 변수 = 3/8 × 1 = 3/8

앞면이 총 2개 나올 확률 × 확률 변수 = 3/8 × 2 = 6/8

앞면이 총 3개 나올 확률 × 확률 변수 = 1/8 × 3 = 3/8

 

E(X) = 평균(기댓값) = 12/8 = 1.5

 

동전 던지기를 3번했을때 앞면이 나올 기댓값은 1.5번이다.

즉, 동전던지기를 3번을 하면 평균 1.5번의 앞면이 나온다 이 말이다.

 

평균.. 뜻은 이미 우리가 다 알고 있다. 용어가 그지 같이 어렵게 만들어서 그렇지

다음은 분산이다.

 

 

 

분산 [Variance Value] : 평균으로부터 얼마나 벗어나 있는지 거리의 척도.
  1. V(X) = E(X-μ)²

▶ 분산은 설명대로 거리의 척도이고, 음의 거리는 존재하지 않기 때문에

분산은 제곱 값을 사용한다.

 

식을 보면 알겠지만 확률변수에 평균값을 뺀 값을 그냥 제곱한 거다.

평균이랑 차이가 얼마나 나는지 제곱 값으로 보자는 거다.

 

위식을 계산하기 쉽게 바꿔보자 2차 방정식이다 그냥 봐라.

 

V(X) = E(X - μ)²

      = ∑(x - μ)² × f(x)

      = x²f(x) - 2μ∑xf(x) + μ²f(x)

       

          → ∑xf(x)는 평균 μ이기 때문에 -2μ∑xf(x) =-2μ²이 된다.

          f(x) = 1이다 확률의 합은 1이기 때문이다. 모르면 안 된다. 

       

      위에 것을 다 계산하면 아래와 같이 된다.

 

      = E(X²) - μ²

 

      즉, 확률변수 제곱의 평균  - 기존 확률변수 평균의 제곱이다.

 

분산은 이렇게 계산되게 된다. 어려운가 아니니까 알아놓자

 

 

 

728x90