본문 바로가기

경영통계학

경영학과, 경제학과, 경영학 등 필수과목 경영통계학 요점 정리 10. 자료의 표준화와 극단값

반응형

10. 자료의 표준화와 극단값

 

1) 데이터 배열에서 항목들의 위치에 관한 원리


(1) 체비셰프 정리(Chebyshev's theorem)
어떤 데이터이든 그리고 , k ( , 그 분포가 무엇이든 상관없이 평균으로부터 표준편차 이내 즉

2) 표준화 값(standardized value) z 또는 점수


(1) . 각 관측치와 평균과의 거리가 표준편차의 몇 배인지를 나타냄
(2) :

▶  z값이 음수이면 관측치가 평균의 왼쪽에 있음을 의미
▶  z값이 양수이면 관측치가 평균의 오른쪽에 있음을 의미
(3) : =STANDARDIZE(x , , ) 엑셀 함수 값 평균 표준편차


(4) 예시
▶  첫 월급 자료의 표준화

 

3) 특이값(outlier) 


(1) 어떤 자료 안에 포함된 특출나게 큰 값이나 작은 값
(2) 부정확하게 관측 또는 기록되어 자료에 포함된 값 정확하게 기록된 특별한 값
(3) z표준화 z점수에 따라 이상 관측치를 분류할 수 있음

반응형