2021. 2. 9. 23:42ㆍ지식/수학
평균(기댓값) [Expected Value] : 확률 변수의 기댓값.
- E(X) = ∑ x * f(x)
- μ (그리스 문자로 표기하며 발음은 "뮤"이다.)
▶ 위에서 설명했다시피 통계학에서 (기본) 평균은 확률 변수의 기댓값이다.
여기서부터 막히는데 확률변수가 뭐냐? 예를 들어서 보면 쉽다.
동전 던지기를 3번 할 때, 앞면이 나올 확률 변수는 X는
{0, 1 ,2 ,3}이다. 말이 어렵지 그냥 앞면이 나오는 횟수가 몇 회냐 이게
확률 변수 "X"이다.
그럼 위식 "∑ x * f(x)" 은 무엇이냐.
f(x)를 확률 함수라고 부르는데 그냥 확률 변수 x가 나올 확률이다.
차근차근 생각해보면, 자 동전 던지기를 3번 했을 때 앞면이 나오는 횟수의
기댓값이 얼마인지 보자
우선 동전 던지기 3번 했을 때의 총경우의 수는 몇 개인가?
각 동전 별로 앞/뒤가 있으니까 2X2X2 = 8 개의 경우를 갖는다.
그렇다면 앞면이 0개 나올 경우의 수는
전체 뒷면이 나올 경우 즉 1번의 경우가 있다
그러면 확률은 1/8이다. 이렇게 순서대로 적어보면
앞면이 총 0개 나올 확률 × 확률 변수 = 1/8 × 0 = 0
앞면이 총 1개 나올 확률 × 확률 변수 = 3/8 × 1 = 3/8
앞면이 총 2개 나올 확률 × 확률 변수 = 3/8 × 2 = 6/8
앞면이 총 3개 나올 확률 × 확률 변수 = 1/8 × 3 = 3/8
E(X) = 평균(기댓값) = 12/8 = 1.5
동전 던지기를 3번했을때 앞면이 나올 기댓값은 1.5번이다.
즉, 동전던지기를 3번을 하면 평균 1.5번의 앞면이 나온다 이 말이다.
평균.. 뜻은 이미 우리가 다 알고 있다. 용어가 그지 같이 어렵게 만들어서 그렇지
다음은 분산이다.
분산 [Variance Value] : 평균으로부터 얼마나 벗어나 있는지 거리의 척도.
- V(X) = E(X-μ)²
▶ 분산은 설명대로 거리의 척도이고, 음의 거리는 존재하지 않기 때문에
분산은 제곱 값을 사용한다.
식을 보면 알겠지만 확률변수에 평균값을 뺀 값을 그냥 제곱한 거다.
평균이랑 차이가 얼마나 나는지 제곱 값으로 보자는 거다.
위식을 계산하기 쉽게 바꿔보자 2차 방정식이다 그냥 봐라.
V(X) = E(X - μ)²
= ∑(x - μ)² × f(x)
= ∑x²f(x) - 2μ∑xf(x) + μ²∑f(x)
→ ∑xf(x)는 평균 μ이기 때문에 -2μ∑xf(x) =-2μ²이 된다.
→ ∑f(x) = 1이다 확률의 합은 1이기 때문이다. 모르면 안 된다.
위에 것을 다 계산하면 아래와 같이 된다.
= E(X²) - μ²
즉, 확률변수 제곱의 평균 - 기존 확률변수 평균의 제곱이다.
분산은 이렇게 계산되게 된다. 어려운가 아니니까 알아놓자
'지식 > 수학' 카테고리의 다른 글
[통계학] 평균/분산/표준편차 설명 (0) | 2021.03.10 |
---|---|
[통계학] 분위수, 백분위수, 사분위수 (0) | 2021.03.03 |
[통계학] 이변량 확률변수 (0) | 2021.02.17 |