상호작용

FrontPage|FindPage|TitleIndex|RecentChanges| UserPreferences P RSS
교호작용 혹은 상호작용 (interaction) 효과: 특정변인의 효과가 다른 변인의 수준에 따라 달라지는 것.



1. 여러가지 상호작용

  • Synergism : 1 + 1 > 2

  • Potentiation : 1 + 1 > 10
    이것은 하나의 변인이 독립적으로는 거의 아무런 영향을 주지 못하지만, 다른 변인과 합쳐질 때 비로소 작용하는 것을 뜻한다. 이것은 창발성과도 관련이 있다고 할 수 있을 것이다. 존재하지 않았던 action 이 나타나기 때문이다.

  • Anatagonism (길항) : 1 + 1 < 2

2. 상호작용의 분석

예로 철(iron)의 경도는 온도와 압력, 두개의 변수만의 영향을 받는다고 할때, 온도만을 일정량 증가시킬경우 경도가 10이 증가하고, 압력만을 증가시켰을 경우 5가 증가했을때, 동시에 온도와 압력을 증가시켰더니, 20이 증가했다고 하면, 여기서 추가로 늘어난 5만큼의 경도는 온도와 압력의 교호작용에 의한 것이라고 하며, 통계적으로 정량화한다. 이러한 Synergism 도 전체는 부분의 합보다 크다는 창발성과 일맥상통하는 상호작용의 예라고 볼 수 있을 것이다.

어떠한 미지의 시스템을 분석하기 위해 갖가지 실험을 수행한다. 그리고, 이 실험결과를 통계적으로 분석하는 과정에서 특정 변수사이의 교호작용을 알아낼 수 있다. 만일 변수가 A, B, C, D, E 이렇게 다섯개가 있다고 하면, 예측가능한 교호작용은,

 A*B, A*C, A*D,.....
 A*B*C, A*B*D, A*B*E, ....
 A*B*C*D, A*B*D*E,.....
 A*B*C*D*E

등의 조합들로 표현가능하다. 독립변수가 discrete 한 경우 이는 5개의 독립변수를 가진 다원분산분석이 되고, 5C1 + 5C2 + 5C3 + 5C4 + 5C5 의 조합의 합인 31개의 그룹이 나오게 되어서 전체 편차 중에서 각각의 조합이 미치는 편차를 분석해 낼 수 있다. 이것은 분산분석(ANOVA)의 원리인 편차의 분해에 근거한다.

{{|
한 개체의 편차(총편차) = 개체의 값 - 전체평균 = 그룹내 편차 + 그룹간 편차 = (개체의 값 - 그룹내 평균) + (그룹내 평균 - 전체평균)
|}}

다원분산분석의 경우, SPSS 에서는 GLM 으로 돌려볼 수 있다. 이론적으로 모든 변수의 모든 교호작용을 관찰하면, 그 시스템을 정확히 해석할 수 있을 것이나, 현실적으로는 computationally 한계가 있다.

3. 회귀분석에서의 상호작용

우선 상호작용 없이 단지 두 독립변인의 주효과만을 보는 선형회귀분석의 방정식을 생각해보면 다음과 같습니다:

{{|
y = A + B1*x1 + B2*x2 + U
|}}

여기서 x1과 x2는 각각 두 개의 독립변인의 값을 의미하는 것이고 B1과 B2는 각각 두 독립변인이 종속변인 y에 미치는 "효과"를 나타내는 계수입니다. (See also PearsonCorrelation) 여기까지가 선형회귀분석의 기본이고, 이제 우리가 변인 x1의 효과가 다른 조건들이 달라지면 달라질 것이라는, 가령 x1의 효과가 다른 변인인 x2의 값에 따라 달라진다는 두 변인 간의 상호작용효과를 알아보고 싶다고 가정해봅시다.

구체적인 예를 들어보자면, 수입(income)이 나이(age)에 따라 증가하는 정도가 노동자들에게보다 화이트칼러 직종의 사람들에게 더 클 것이라는 예측이 가능한데 이 경우에 "나이와 직업이 수입에 미치는 상호작용 효과가 있다"라고 말할 수 있는 것입니다.

그러면 회귀분석 방정식에서 이 상호작용 효과의 개념은 어떻게 표현이 될까요?

아까 위에 예를 든, 세 개의 변인을 이용한 방정식으로 다시 돌아가서 생각해봅시다. 여기서 우리는 "나이"의 효과가 "학업수준"에 따라 달라진다는 것을 나타내는 상호작용 방정식을 가정해봅니다. (다시말해서 "나이"가 "수입"에 미치는 영향이 "학업수준"이 높을수록 더 커질 것이다를 가정해본다는 이야기입니다.)

이것을 표현하는 것은 여러가지 방법이 가능하겠지만 가장 간단하고 많이 쓰이는 방법은, 나이의 효과를 나타내는 계수가 학업수준의 선형함수임을 가정하는 것입니다. B1이 나이의 계수이고 x2가 학업수준이라면 이 선형회귀 방정식은 다음과 같습니다:

{{|
B1 = C + D*x2
|}}

여기서 C와 D는 앞으로 추정되어야할(구해져야할) 계수들입니다.

우리의 본래의 가설은 "나이가 수입에 미치는 효과가 학업수준이 높은 사람들에게 (낮은 사람들에게보다) 더 클 것이다"였지요. 이 모델을 추정하기 위해서 방금 구한 방정식, B1을 맨위의 변인 세 개짜리 방정식에 대입을 시킵니다, 아래와 같이:

{{|
y = A + (C + D*x2)x1 + B2*x2
|}}

그리고나서 위 방정식에서 괄호를 풀어주고 순차적으로 정리하면 다음과 같이 되겠지요:

{{|
y = A + C*x1 + B2*x2 + D*x2*x1
|}}

이 방정식은 본래 방정식의 x1과 x2의 항을 그대로 가지고 있으면서 또한 "x1과 x2의 곱"을 추가변인으로 가지고 있는데 바로 이 곱의 항이 변인 x1과 변인 x2의 상호작용 항이 되는 것이고 이 곱의 계수인 D가 두 변인 간 상호작용의 효과를 나타내는 계수가 되는 것입니다. 이 방정식은 통계프로그램 등을 이용해서 쉽게 추정해낼 수가 있습니다.

요컨대 이런 식으로 "회귀분석에서의 상호작용" 항은, 상호작용이 있으리라고 가정되는 "두 변인의 곱(product)"으로 표현되는 것입니다.

4. 상호작용창발성의 관련성 토론

개인적으로 창발성에 관심이 많아요. 많이 공부하고 싶고... 상호작용창발성연구에 있어 중요한 수단일듯한 생각입니다. --yong27

생각해보니까 저희 쪽 분야, 사회과학 쪽에서는 아무래도 '상호작용'이 '창발성'이라는 개념하고 연관되기가 좀 곤란한 측면들이 많이 있고, 상호작용이 단지 '조건화, '특정조건'을 밝히는 경우가 많지만, yong27님이 공부하시는 생물학이나 또는 화학 쪽 분야에서는 상호작용창발성하고 더많이 연결될 수 있을 것같다는 생각이 들더군요. 사회를 연구하는 데에도 그 두 가지 개념이 연관이 될 수 있을지 저도 한번 생각해보죠, 만일 가능하다면 이쪽 분야에선 어떤 식의 설명이 가능하지 머 그런 거 좀더 생각해볼까봐요.^^ --우산

일단은 PearsonCorrelation페이지에 술소비량과 교통사고증가율을 회귀분석의 예로 썼었습니다만, 상호작용은 좀처럼 구체적 예가 떠오르지 않네요. 어떤 A라는 사회현상에 영향을 미치는 변수들을 좌악 써보고, 설문테스트나 각종 자료들, 통계데이타등을 사용해서 변수들 사회현상을 수식으로 표현해보고, 거기서 상호작용을 추론해보는 방법도 있겠죠? 상호작용으로 표현되는 변수들을 나열해보면, 이런 변수들이 종합적으로 A라는 사회현상에 창발적특성들을 부과한다...- --yong27

5. 토론 및 질의응답

Q1 : 이렇게 놓고보면 왠지 시스템이 환원론적으로 표현된거 같은데, 그렇담 전체론적인 창발성과는 어떻게 되는거죠?
A1 : 환원론이라고는 생각하기 어렵지 않을까요? 환원론이란 전체 시스템을 작은 component 로 분해했을때 각각을 정확하게 이해하기만 하면 전체도 완벽하게 이해할 수 있다는 것이고, 여기서는 그 뿐 아니라 interaction 까지도 분석해야 한다는 것이니까요.

Q2 : 그렇군요. 왠지 창발성이란것이 이렇게 수식적으로 표현되는걸 보니깐, 이것도 일종의 환원론이 아닌가 생각했죠. 그렇다면, 모든 교호작용의 합 = 창발성 이라고 얘기할수 있을까요?
A2 : 이론적으로 가능할 것 같군요. 하지만 실제로 계산해 내는 문제는 좀 틀린 문제죠. Gene interaction, genetic network 와 같이 O(b^n)의 exponential 한 problem 이라서 변수가 많아지면 감당이 안되겠죠.

Q3 : 회귀분석에서 interaction term은 변인 A와 B의 상호작용 효과는 A*B 이런 식으로 각 변인간의 곱셈으로 계산한다고 하는데, 각 변인간의 곱셈이라는 것이 뭔지 잘 모르겠네요. 회귀분석에서 변수간의 상호작용에 대해서는 어떤 식으로 알 수 있는지 궁금하군요. 최적회귀방정식을 선택할때도 기여도가 큰 변수를 selection 하거나 기여도가 작은 변수를 elimination 하는 걸로 알고 있는데, 상호작용을 알려면 다원분산분석에서처럼 결국 모든 조합을 선택해서 총편차에 각 편차들이 기여하는 바를 봐야 하는게 아닌지? 혹시 다른 방법이?
A3 : 위의 "회귀분석에서의 상호작용" 참조하세요.



"; if (isset($options[timer])) print $menu.$banner."
".$options[timer]->Write()."
"; else print $menu.$banner."
".$timer; ?> # # ?>