3. 변수, 측정수준, 표본추출의 개념
1) 변수
▶ 자료의 형태와 변수의 개수에 따라 분석의 주제와 방법이 달라짐
(1) 변수의 구분
▶ 단일변량 변수 (univariate) : 한 개인 자료집합
▶ 이변량 변수 (bivariate) : 두 개 자료집합
▶ 다변량 변수 (multivariate) : 세 개 이상 자료집합
자료집합 | 변수 | 예 | 주요 작업 |
단일변량 | 1개 | 소득 | 히스토그램, 기본 통계량 |
이변량 | 2개 | 소득, 나이 | 산포도, 상관성 |
다변량 | 3개 이상 | 소득, , 나이 성별 | 회귀분석 |
2) 측정수준(level of measurement)
▶ 자료에 있는 정보량을 결정함.
▶ 가장 적절한 자료의 요약방법과 통계적 분석을 결정함.
(1) (Nominal scales) 명목척도
▶ 요소의 속성을 구분하기 위해 라벨이나 명칭을 사용하는 자료
▶ 비수치적 라벨이나 숫자코드가 사용됨.
▶ 예시 : 학생들은 경영학, 인문학, 교육학 등 비수치적 기호를 사용하여 그들이 속한 학부에
따라 분류되거나 숫자를 써서 분류할 수도 있음 경영학은 .( 1, 2, 3) 인문학은 교육학은
(2) (Ordinal scales) 서열척도
▶ 명목척도의 특성을 가지고 있으면서 순서와 서열을 가지고 있는 자료
▶ 비수치적 라벨이나 숫자코드가 사용됨.
▶ 대학생들은 1학년 2학년 3학년 4학년과 같은 비수치적 라벨로 지위를 분류하거나 숫자로
지위를 나타낼 수 있음 학년은 .(1 1, 2 2) 학년은
(3) (Internal scales) 등간척도
▶ 서열척도의 특성을 가지고 있으며 관찰 , 값들 사이의 구간이 특정 고정된 측정단위로 표현되
는 자료
▶ 항상 숫자로 나타남.
▶ 숫자 0 , . 을 포함할 수 있지만 절대적 의미가 아닌 임시적 기준의 역할임
▶ 예시 : IQ 135 , IQ 120 , 15 . 원빈은 가 이고 장동건은 가 이면 원빈은 장동건보다 점 더 높음
(4) (Ratio scales) 비율척도
▶ 등간자료의 특성을 모두 가지고 있으며 두 , . 값의 비율이 의미가 있음
▶ 거리 높이 무게 시간 , , , . 같은 변수들은 비율척도를 사용함
▶ 그 변수에 대해 아무것도 존재하지 않는다는 것을 의미하는 ‘0’을 포함함.
▶ 예시 : 36 , 72 , 원빈은 학점을 획득하였고 장동건은 학점을 이수하였다면 장동건은 원빈보다
2 . 개 많이 이수하였음
3) 표본추출의 개념
(1) 모집단과 표본
▶ 모집단 조사자가 (population) : ( : 관심을 두는 모든 항목으로 유한일 수도 있고 예시 어떤
비행편의 모든 탑승객 사실상 ), . ( : ) 무한일 수도 있음 예 생산 설비에서 출하되는 모든 콜라
▶ 표본 모집단 (sample) : 중 조사자가 실제로 분석하는 부분집합
▶ 전수조사 어떤 (census) : 모집단에 속해 있는 모든 항목들을 조사하는 것
▶ 표본조사 : 모집단에서 일부 항목들만 뽑아 그것을 살펴보는 아이디어
▶ 표본추출틀 표본을 (sampling frame) : ( : 115,000 ) 추출하는 대상 그룹 예시 개 주유소
(2) 모수와 통계량
▶ 모수 (parameter) : 모집단에 ( : ) 대한 측정 또는 특징 예시 평균 또는 비율
▶ 통계량 (statistic) : 어떤 표본으로 계산한 측정치
▶ 각 모수와 그에 대응하는 통계량에 서로 다른 기호를 사용함.
(3)표본추출방법
▶ 단순무작위추출(simple random sample)
- 모집단에 있는 N 개의 모든 항목들이 표본으로 선택될 가능성이 서로 동일하도록 표본을
무작위로 뽑는 방법
▶ 계통추출(systematic sampling)
- 주어진 리스트 중 처음 k 개의 항목에서 무작위로 하나를 고르고 그 다음부터는 매 k 번째
항목을 계속 추출해 나가는 방법
- 예시: 두 번째 항목에서 시작하여 매 네 번째 항목을 추출함으로써 총 N=78 개 항목에서
n=20 개 항목의 표본을 만드는 것을 보여줌 N/n=78/20 ≈ 4 (주기)
▶ 층화추출(stratified sampling)
- , 모집단이 비교적 성질이 동일하고 크기가 알려진 소그룹 즉 계층 또는 층 (strata) 들로 분
리될 수 있을 때 각 계층 내에서 원하는 크기의 표본을 단순무작위하거나 전체 모집단을
대상으로 임의표본을 추출한 다음 적절한 가중치를 이용하여 각 계층별 추정치를 결합시
키는 방법
- . 모집단에 대한 사전 정보를 활용할 경우 표본의 효율성을 높일 수 있음
▶ 군집표본(cluster sample)
- 층들이 지리적 영역으로 이루어진 경우 무작위로 k개의 하위지역들 또는 군집들 을 골라
거기에 속해 있는 모든 항목들을 추출 단 (1 ) k ( 추출 하거나 일차적으로 개의 하위지역들 또
는 군집들 을 ) , 무작위로 고른 다음 선택된 각 군집에서 다시 무작위표본을 추출하는 방법
(2 단 추출 )
- 예시: 2단 군집추출 무작위로 3개의 군집을 뽑은 다음 각 군집에서 무작위로 4개의 항
목을 뽑음.
▶ 판단표본(judgement sample)
- 비확률적 추출 방법으로서 표본을 추출하는 사람의 전문지식에 의해 모집단을 대표하는
항목들을 추출하는 방법
- .잠재의식적인 편향이 발생할 수 있음 (즉 선택에서 비임의성을 야기)
▶ 편의표본(convenience sampling)
- 어떤 표본이든 간편하기만 하면 그것을 취하는 방법
'경영통계학' 카테고리의 다른 글
경영학과, 경제학과, 경영학 등 필수과목 경영통계학 요점 정리 5. 표와 그래프를 활용한 정량적 자료의 요약 (1) | 2024.07.28 |
---|---|
경영학과, 경제학과, 경영학 등 필수과목 경영통계학 요점 정리 4. 표와 그래프를 활용한 범주형 자료의 요약 (1) | 2024.07.26 |
경영학과, 경제학과, 경영학 등 필수과목 경영통계학 요점 정리 2. 자료의 구성과 유형 (1) | 2024.07.24 |
경영학과, 경제학과, 경영학 등 필수과목 경영통계학 요점 정리 1. 비즈니스와 통계학 (9) | 2024.07.23 |
경영학, 검색 광고 마케터 1급 시험 등 광고학 요점 정리 50. 통합적 태도형성(변화)모형 (1) | 2024.07.22 |