지식/수학(4)
-
[통계학] 평균/분산/표준편차 설명
1. 평균(Mean) - 어떤 변수의 합계가 고정되어 있을 때, 모든 관측치가 똑같이 나누어 가질 수 있는 값. 다 알고 있는 내용이지만 수식을 쓰자면 다음과 같다. 변수 x의 평균은 모든 관측치의 값을 다 더한 다음 관측치의 개수 n으로 나눠 계산한다. 평균의 표기법은 위와 같이 변수x에 "모두 같다"라는 의미로 "ㅡ"를 얹어 표기한다. 평균은 통계학에서 값의 상대적 위치를 알려준다. 내가 시험 점수가 60점이라고 했을 때 만약 평균이 30점이라면 내가 시험을 상대적으로 잘 본 것이고, 평균 이 80점이라고 했을 때 나는 상대적으로 시험을 못 본 축에 들게 되는 것이다. 2. 분산(Variance) - Data의 서로 다른 관측치가 완전히 똑같은 값을 갖는 경우는 거의 없습니다. 거의 모든 Data의 ..
2021.03.10 -
[통계학] 분위수, 백분위수, 사분위수
자 위표는 100명의 대학생의 통계시험 점수표다. 점수를 보면 3점이 꼴등이고 100점이 1등이다. 여기서 하위 20명을 과락 시킨다면 적어도 몇 점을 받아야 과락을 면할 수 잇을까? 정렬을 해서 확인을 해보면 최소 17점을 맞아야 과락을 면할 수 있다. 이렇게 경쟁이나 상대평가에서는 점수보다는 점수의 위치(순위)가 중요하다. 예를 들어 만약 물수능 이라면 98점을 맞아도 100점이 너무 많아 2등급이 되었던 것처럼 말이다. 여기서 분위수(Quantile) 란 위 예에서 과락의 기준인 17점 처럼 '기준이 되는 특정한 점수'들을 말한다. 그 중 가장 대표적인 예가 여러분이 한번은 들어 봤을 백분위수(Pecentile) 이다. 백분위수는 표본을 100등분하여 그 대표 기호인 %를 사용하는 분위수를 말한다...
2021.03.03 -
[통계학] 이변량 확률변수
이변량확률변수 (Two Dimesional Random Variable) f(x, y)의 결합확률 예) 두개의 주사위를 굴릴 경우 X = 빨간색 주사위 Y = 파란색 주사위 Rx = {1, 2 ,3 ,4 ,5 ,6} Ry = {1, 2 ,3 ,4 ,5 ,6} 이변량 확률변수 (Rxy) Rxy = {(1,1), (1,2), (1,3) · · · · ·(6,6)} 36개의 경우가 존재함 주변확률 함수를 g(x),h(y)라했을 때 각각의 값은 ∑ f(x,y)를 사용하여 표기하며 모든 x에 대해 ∑ f(x,y) = h(y) 모든 y에 대해 ∑ f(x,y) = g(x) 라한다. 아래 표를 보면 이해가 쉽다 표를 보면서 보면 말이 어렵지 어렵지 않다. 그냥 X가 1이 나올 주변확률 함수 g(1)의 경우 X = {1..
2021.02.17 -
[통계학] 평균과 분산 (Expected Value , Variance Value)
평균(기댓값) [Expected Value] : 확률 변수의 기댓값. E(X) = ∑ x * f(x) μ (그리스 문자로 표기하며 발음은 "뮤"이다.) ▶ 위에서 설명했다시피 통계학에서 (기본) 평균은 확률 변수의 기댓값이다. 여기서부터 막히는데 확률변수가 뭐냐? 예를 들어서 보면 쉽다. 동전 던지기를 3번 할 때, 앞면이 나올 확률 변수는 X는 {0, 1 ,2 ,3}이다. 말이 어렵지 그냥 앞면이 나오는 횟수가 몇 회냐 이게 확률 변수 "X"이다. 그럼 위식 "∑ x * f(x)" 은 무엇이냐. f(x)를 확률 함수라고 부르는데 그냥 확률 변수 x가 나올 확률이다. 차근차근 생각해보면, 자 동전 던지기를 3번 했을 때 앞면이 나오는 횟수의 기댓값이 얼마인지 보자 우선 동전 던지기 3번 했을 때의 총경우..
2021.02.09