경영통계학
경영학과, 경제학과, 경영학 등 필수과목 경영통계학 요점 정리 10. 자료의 표준화와 극단값
!nuna!
2024. 8. 5. 04:22
반응형
10. 자료의 표준화와 극단값
1) 데이터 배열에서 항목들의 위치에 관한 원리
(1) 체비셰프 정리(Chebyshev's theorem)
▶ 어떤 데이터이든 그리고 , k ( , 그 분포가 무엇이든 상관없이 평균으로부터 표준편차 이내 즉
2) 표준화 값(standardized value) z 또는 점수
(1) . 각 관측치와 평균과의 거리가 표준편차의 몇 배인지를 나타냄
(2) :
▶ z값이 음수이면 관측치가 평균의 왼쪽에 있음을 의미
▶ z값이 양수이면 관측치가 평균의 오른쪽에 있음을 의미
(3) : =STANDARDIZE(x , , ) 엑셀 함수 값 평균 표준편차
(4) 예시
▶ 첫 월급 자료의 표준화
3) 특이값(outlier)
(1) 어떤 자료 안에 포함된 특출나게 큰 값이나 작은 값
(2) 부정확하게 관측 또는 기록되어 자료에 포함된 값 정확하게 기록된 특별한 값
(3) z표준화 z점수에 따라 이상 관측치를 분류할 수 있음
반응형