Statistics & Math/기초통계학

[기초통계학] Two-way ANOVA(이원배치 분산분석)(1) - Interaction(상호작용)

YSY^ 2021. 2. 14. 20:52

[기초통계학] One-way ANOVA(일원배치 분산분석) : ysyblog.tistory.com/174

 

[기초통계학] One-way ANOVA(일원배치 분산분석) (F-Value)

One-way ANOVA 세 집단 비교 T-test는 두개 집단이 유사한지 아닌지 비교하는 것입니다. 그런데 만약 집단이 3개라면 어떻게 될까요. 물론 T-test를 3번하면 될것입니다. 하지만 그룹이 3개일때 t-test를

ysyblog.tistory.com

위의 일원배치분산분석 포스팅에서 이어집니다.

Two-way ANOVA

- 독립변수가 2개 + α 인 경우 사용하는 ANOVA입니다.
- A라는 변수의 그룹들과 B라는 변수의 그룹들에 따라 종속변수가 변화할 것이라는 모델에서 사용
- 여기서 독립변수는 Main Effect(주효과)가 있다고 한다.
- Main Effect란 어떤 변수에 따라 종속변수가 바뀌는 것이다.
- 따라서 Two-way ANOVA는 Main Effect가 두개이다.(한개의 독립변수는 한개의 Main Effect가 있음)

Two-way ANOVA의 가정

  • 정규성 : 모집단들은 정규분포를 따름
  • 독립성 : 모집단으로부터 무작위적으로 표본을 추출함
  • 등분산성 : 모집단들은 동일한 분산을 가짐
  • 직교성(orthogonality) : 두 개의 요인이 서로 상관관계가 없을 것
  • 직교성을 만족함은 상호작용이 없음과 전혀 관련이 없다

 

Interaction(상호작용/교호작용)

- α는 interaction(상호작용/교호작용)임
- interaction(상호작용/교호작용)이란 한 독립변수의 Main Effect가 다른 독립변수의 level(group)에 따라 원래의 linear relationship가 non-linear하게 변하는 경우
- linear relationship이란 선형관계이다. 즉, 독립변수와 종속변수의 관계가 직선(선형)관계가 있다고 이미 전제된 것이다. t-test든 ANOVA든 선형관계는 이미 전제되어 있는 것이다.

다양한 상황에서 Main Effect와 Interaction에 대해 알아보겠습니다.

밑의 예시는 온도(temperature)와 습도(humidity)에 따른 Cockroach의 성장도입니다.

독립변수는 당연히 온도와 습도가 되겠습니다.

위 상황에서는 온도와 습도 모두 Main Effect가 없습니다. 두 독립변수의 집단들의 평균값이 같기때문입니다. 온도가 20일때나 30일때나 성장값의 평균은 20으로 똑같기 때문에 종속변수가 변하지 않아 Main Effect가 없으며, 습도역시 33%일때와 66%일때 성장값의 평균이 20으로 같기 때문에 종속변수가 변하지 않아 Main Effect가 없습니다. Interaction effect 역시 없는데 온도와 습도의 직선관계가 변하지 않았기 때문입니다.

위 상황에서 온도는 Main Effect가 유의합니다. 온도가 20일때 종속변수의 평균이 10이고 온도가 30일때 종속변수의 평균이 30으로 종속변수가 변하기 때문입니다. 하지만 습도는 33%일때나 66%일때나 종속변수의 평균은 20이기 때문에 Main Effect가 없습니다. Interaction effect는 없는데 온도의Main Effect가 습도에 따라서 변하지 않기 때문이다.

위 상황에서 온도는 Main Effect가 없습니다. 종속변수의 평균값 온도가 20이나 30일때나 모두 20으로 동일하기 때문입니다. 반면 습도는 Main Effect가 유의합니다(있습니다).습도가33%일때종속변수의 평균은 10이며, 습도가 66%일 때 종속변수의 평균값은 30이기 때문입니다. 하지만 Interaction effect는 없는데 습도의 Main Effect가 온도에 따라 바뀌지 않았기 때문입니다.

위 상황에서 온도와 습도 모두Main Effect가 있습니다. 습도나 온도 모두 변하면 종속변수의 값이 변하기 때문입니다. 하지만Interaction effect는 없는데 온도와 습도 모두 동일하게 똑같이 가기 때문입니다.

위 상황에서는 온도와 습도 모두 Main Effect가 없습니다. 온도가 20도일때나 30도일때나 종속변수값의 평균이 같기 때문이며, 습도 역시 똑같습니다. 하지만 Interaction effect는 있는데 온도에 따라서 습도가 변하고 또한 습도가 변할때도 온도가 변하기 때문입니다.즉, 두개의 독립변수의 어느것이더라도 다른 독립변수에 따라 변하면 interatcion effect가 있는 것이다.

위 상황에서 온도와 습도 모두Main Effect가 있습니다. 습도나 온도 모두 변하면 종속변수의 값이 변하기 때문입니다. 또한 Interaction effect도 있는데 한케이스에서는 변하지않는데 다른케이스에서는 변하기 때문입니다.

 

결론

Interaction이란, 한 독립변수의 종속변수에 대한 영향관계가 다른 독립변수의 level(=group)에 따라 변할 경우 Interaction effect(상호작용)이 있다고 합니다.

이는 연구/조사에 있어서 매우 중요한데, 기존에 이런 변화가 있음이 알려져있지 않으면, 이런 두 변수를 이용하여 다양한 결과를 예측할 수 있는 길이 열리기며 기존에 원인을 알 수 없었던 종속변수의 결과에 대해 그 원인을 알 수 있는 바탕이 되기 때문입니다.

728x90
반응형