변수(Variable)
정보가 수집되는 특정한 개체나 대상 (보통 열(Column) 값들을 의미)
질적변수 / 양적변수(데이터의 특성에 따른 분류)
질적변수(Qualitative Variable)
- 변수의 값이 비수치적 특정 카테고리에 포함 시키도록 하는 변수 (ex.색상, 성별, 종교)
- 명목변수(Nominal Variable): 변수의 값이 특정한 범주(Category)에 들어가지만 해당 범주간 순위는 존재하지 않는 것 (ex.혈액형)
- 순위변수(Ordinal Variable): 변수의 값이 특정 범주에 들어가면서 변수의 값이 순위를 가지는 경우 (ex.성적)
양적변수(Quantitative Variable)
- 변수의 값을 숫자로 나타 낼 수 있는 변수 (ex. 키, 몸무게, 소득)
- 이산변수(Discrete Variable): 하나하나 셀 수 있는 변수 (ex.정수)
- 연속변수(Continuous Variable): 이산변수와 다르게 변수의 값 사이에 무수히 많은 또 다른 값들이 존재하는 경우 (ex.실수)
- 등간변수: 변수들 순서뿐만 아니라 순서 사이의 간격을 알 수 있는 변수
- 비율변수: 등간변수의 특성에 더하여 측정데이터 간의 비율계산이 가능한 변수
독립변수/종속변수/통제변수 (자료의 관계에 따른 분류)
독립변수(Independent variable)
- 연구자.조사자가 의도적으로 변화시키는 변수
- 예측변수(predictor variable), 설명변수(explanatory variable)라고도 함.
- 여기서 독립은 논리적 관계에서의 독립을 의미
- 주로 인과관계를 조사하기 때문에, 이 인과관계에서 독립적인 위치는 결과보다는 원인이기 때문에, 인과관계에서 원인이 되는 변수가 독립변수이다.
- 독립변수가 연구자가 의도적으로 변화시킬 수 있다고 하여 마음대로 해도 되는 것은 아니다.
종속변수(Dependent variable)
- 연구자가 독립변수의 변화에 따라 어떻게 변하는지 알고 싶은 변수
- 반응변수(response variable) 혹은 결과변수(outcome variable)
- 여기서 종속은 논리적 관계에서의 종속을 의미한다
- 주로 인과관계를 많이 연구하므로 이때 이 인과관계에서 종속적인 위치는 원인보다는 결과이다.
- 따라서 인과관계에서 결과가 되는 변수가 종속변수이다.
통제변수(Control Variable)
- 기본적으로는 독립변수와 비슷하나, 연구./.조사의 주된 관심사가 되는 변수가 아닌 경우를 지칭
- 예를들어, 고객만족과 재방문률을 연구할 때 고객만족이 독립변수, 재방문률이 종속면수임. 하지만 재방문율에 영향을 미치는 변수가 하나이지 않고 여러개일 것이기 때문에 다른 중요한 변수들을 감안해야함
- 다른 중요한 변수를 감안하고도 고객만족이 중요한 역할을 한다면, 고객만족은 정말 중요한 변수이다.
- 통제변수를 한 개도 감안하지 않은 경우 Model Misspecification이 발생한다.
- Model Misspecification : 모델이 잘못되었다는것(매우 중요한 변수들이 빠져있다는 의미)
척도(Scale)
- 명목척도 (nominal scale)
- 척도의 명칭만 의미 있음.
- (예) 결혼 상태에 대한 코드: { 미혼=1, 기혼=2, 이혼=3, 사별=4}
- 순서척도 (ordinal scale)
- 명칭 및 순서가 의미를 지님.
- (예) 성적 등급 - {poor=1 , fair=2 , good=3 , very good=4 , excellent=5}
- 간격척도 (interval scale)
- 명칭, 순서 및 간격이 의미를 지님.
- (예) 온도
- 비율척도 (ratio scale)
- 명칭, 순서, 간격 및 배율 모두 의미를 지님.
- 이들 척도의 경우 이른바 “절대적 원점(absolute zero point)”이 정의됨.
- (예) 키, 몸무게, 재산 등
'Statistics & Math > 기초통계학' 카테고리의 다른 글
[기초통계학] 실험연구와 경험적연구(자연실험) (0) | 2024.03.10 |
---|---|
[기초통계학] 통계학과 자료 / 선택편향과 생존편향 (0) | 2024.03.10 |
[기초통계학] 표본 분포와 중심극한정리 (0) | 2024.03.02 |
[기초통계학] 지수분포(지수분포의 기댓값과 분산,지수분포의 무기억성) (0) | 2024.02.18 |
[기초통계학] 확률밀도함수 (연속확률분포, 균등분포) (1) | 2024.01.06 |