인과모형

Causal model
fMRI 영상의[1] 해석에 사용되는 두 개의 경쟁적 인과관계 모델(DCM, GCM)의 비교

과학철학에서 인과모형(또는 구조적 인과모형)은 시스템인과 메커니즘을 기술하는 개념적 모델이다. 원인 모델은 어떤 독립 변수를 포함/제어해야 하는지를 결정하기 위한 명확한 규칙을 제공함으로써 연구 설계를 개선할 수 있다.

그들은 무작위 조정 시험과 같은 중재적 연구의 필요 없이 기존의 관측 데이터로부터 일부 질문에 대답할 수 있다. 일부 중재적 연구는 윤리적 또는 실제적 이유로 부적절하며, 이는 인과적 모델이 없으면 일부 가설은 시험할 수 없다는 것을 의미한다.

원인 모델은 외부 타당성(한 연구의 결과가 미확정 모집단에 적용되는지 여부)에 대한 질문에 도움이 될 수 있다. 인과 모델은 (특정 상황에서) 여러 연구의 데이터를 병합하여 어떤 개별 데이터 집합으로도 대답할 수 없는 질문에 대답할 수 있게 할 수 있다.

인과 모델은 데이터와 일치하지 않으면 무효로 기각되어야 한다는 점에서 위조할 수 있다. 또한 모델이 설명하고자 하는 현상에 가까운 사람들에게도 신뢰성이 있어야 한다.[2]

원인 모델은 신호 처리, 역학기계 학습에서 응용 프로그램을 찾아냈다.[3]

정의

인과 모델은 개별 시스템 또는 모집단 내의 인과 관계를 나타내는 수학적 모델이다. 그들은 통계 자료로부터 인과 관계에 대한 추론을 용이하게 한다. 그들은 우리에게 인과관계의 인식론과 인과관계와 확률에 대해 많은 것을 가르쳐 줄 수 있다. 그들은 또한 반사실적 논리, 의사결정 이론, 실제 인과관계 분석과 같은 철학자들에게 관심 있는 주제에도 적용되었다.[4]

Stanford Encyclopedia of Philosophy

유대 펄은 인과 모델을 순서형 3중 , V, 로 정의한다 여기서 U는 모델 외부의 인자에 의해 값이 결정되는 외생 변수 집합이고, V는 모델 내의 인자에 의해 값이 결정되는 내생 변수 집합이며, E는 구조 방정식의 집합이다. U와 V의 다른 변수 값의 함수로 각 내생 변수의 값을 표현한다.[3]

역사

아리스토텔레스는 물질적, 형식적, 효율적, 최종적 원인을 포함한 인과관계의 분류법을 정의했다. 흄은 아리스토텔레스의 분류법을 반사실적인 것에 호의적으로 거부했다. 어느 순간, 그는 사물이 하나의 원인을 만들고 또 다른 것을 영향을 주는 "힘"을 가지고 있다는 것을 부정했다.[5]: 264 에 그는 "첫 번째 사물이 존재하지 않았다면, 두 번째 사물은 존재하지 않았을 것"이라고 채택했다.[5]: 265

19세기 후반부터 통계의 기강이 형성되기 시작했다. 갈튼은 생물학적 상속과 같은 영역에 대한 인과 규칙을 규명하기 위해 수년간 노력한 끝에 평균 회귀(스포츠의 2학년 침체로 인식됨) 개념을 도입했고, 이후 상관관계라는 비주의 개념으로 이어졌다.[5]

실증주의자로서 Pearson은 과학의 많은 부분에서 인과관계의 개념을 증명할 수 없는 특수한 연관성 사례로 생략하고 상관 계수를 연관성의 척도로 소개했다. 그는 "동작의 원인으로서의 힘은 나무신(木神)과 정확히 동일하다"고 썼고 인과관계는 "현대 과학의 불가해한 아르카나 가운데서는 페티쉬"에 불과했다. 피어슨은 런던대학바이오메트리카와 바이오메트릭스랩을 설립해 통계학 분야에서 세계 선두주자가 됐다.[5]

1908년 하디웨인버그멘델의 유산을 부활시킴으로써 갈튼이 인과관계를 포기하게 했던 특성 안정의 문제를 해결했다.[5]

1921년 라이트경로 분석은 인과적 모델링과 인과적 그래프의 이론적 조상이 되었다.[6] 그는 기니피그 코트 패턴에 대한 유전, 개발, 환경의 상대적 영향을 풀려고 시도하면서 이 접근법을 개발했다. 그는 이러한 분석이 어떻게 기니피그 출생 몸무게와 자궁 내 시간과 쓰레기 크기 사이의 관계를 설명할 수 있는지를 보여줌으로써 당시의 이단적인 주장을 뒷받침했다. 저명한 통계학자들의 이러한 생각에 대한 반대는 이후 40년 동안 그들을 무시하도록 이끌었다(동물 사육자들 사이에서는 제외). 대신에 과학자들은 부분적으로 라이트 비평가(그리고 선도적인 통계학자)의 지시에 따라 상관관계에 의존했다.[5] 1926년에 처음으로 경로도를 적용하여 중재적 영향력(중재자)을 나타내고 중재자를 계속 보유하는 것이 오류를 유발한다고 주장한 학생인 Burks는 예외였다. 그녀는 독자적으로 경로 다이어그램을 발명했을지도 모른다.[5]: 304

1923년 네이먼은 잠재적 결과라는 개념을 도입했지만 그의 논문은 1990년까지 폴란드어에서 영어로 번역되지 않았다.[5]: 271

1958년 Cox는 변수 Z에 대한 제어는 독립 변수의 영향을 받을 가능성이 매우 낮은 경우에만 유효하다고 경고했다.[5]: 154

1960년대에 던컨, 블락, 골드버거 등이 경로 분석을 재발견했다. 던컨은 블라록의 경로 도표를 읽으면서 20년 전 라이트 교수가 버크스를 차례로 언급한 논문을 언급한 오그번 강연을 기억했다.[5]: 308

사회학자들은 원래 인과관계 모델을 구조 방정식 모델링이라고 불렀지만, 일단 그것이 로테 방식이 되면 효용성을 상실해 일부 실무자들이 인과관계와 어떤 관계도 거부하게 된다. 경제학자들은 이것을 동시 방정식 모델링이라고 부르며 경로 분석의 대수학적 부분을 채택했다. 그러나 경제학자들은 여전히 인과적 의미를 방정식에 귀속시키는 것을 피했다.[5]

첫 논문 발표 후 60년이 지난 후, 라이트는 칼린 외 연구원의 비평에 따라 이를 재점검한 작품을 발표했는데, 이 비평은 선형 관계만을 다루었고, 견실하고 모델 없는 자료의 발표가 더 드러나고 있다고 반대했다.[5]

1973년에 루이스는 인과관계를 대신할 것을 주장했다. 그는 원인이 발생했거나 발생하지 않았고, 그 원인에 따라서만 효과가 나타나는 대체 세계를 상상하는 인간의 능력을 언급했다.[5]: 266 1974년 루빈은 인과적 질문을 위한 언어로 "잠재적 결과"라는 개념을 도입했다.[5]: 269

1983년에 Cartwright는 효과와 "주요적으로 관련이 있는" 요소를 조건화하여 단순한 가능성을 유일한 지침으로 삼을 것을 제안했다.[5]: 48

1986년 바론(Barron)과 케니(Kenny)는 선형 방정식 시스템에서 중재를 탐지하고 평가하는 원칙을 도입했다. 2014년 현재 그들의 논문은 역대 33번째로 가장 많은 관심을 받았다.[5]: 324 그린란드와 로빈스는 반사실적 고려를 통해 교란 요인을 다루는 "교환성" 접근법을 도입했다. 그들은 치료를 받지 않았다면 치료집단에 어떤 일이 일어났을 것인지를 평가하고 그 결과를 통제집단의 결과와 비교할 것을 제안하였다. 일치할 경우 교란 요인이 결석했다고 한다.[5]: 154


무역 쇼크 조건의 직접적인 영향, 경제 자유화에 따른 실질 소득의 악화 및 세계 시장의 가격에 대한 국내 가격의 이동으로 정의되는 b) 국제 경쟁에 대한 전통적인 수출 시장의 개방과 악화로 인한 수출 손실로 정의되는 외부 수요 쇼크(시장 손실)의 직접적인 영향이러한 전통시장의 전반적인 수요에 대하여, c) 전통적인 명시적 예산의 제거와 퀘이부드렛 외부이전으로 정의되는 재정충격의 직접적인 영향, d) 전체 내수의 약화로 인한 거시경제 총계의 추가적인 감소로 정의되는, 위의 모든 충격의 2차적 영향, 즉 외부 수요에 의해 촉발된 거시경제 총계의 추가적 감소로 정의된다.rnal 요인 a), b), c) 이러한 추정치는 아르메니아에 대한 상세한 입력 출력 모델에 기초하여 단일 프레임워크 내에서 얻는다. 모델은 가격, 수요(외부 및 국내), 재정 이전 등 모델의 주요 외부 매개변수를 변경하여 이러한 충격의 직간접적 영향을 추정할 수 있도록 한다. 우리는 또한 총 피할 수 없는 전환 비용에 대한 우리의 추정치와 19881994년 아르메니아의 실제 경제 위축을 비교한다. 그런 다음 우리는 이 비교를 전환 비용 - 90년대 초반의 "잘못된" 개혁 정책과 관련된 비용 -의 간접적인 척도로 사용한다.[7]

인과 사다리

펄의 인과 변형은 그가 인과 사다리라고 부르는 3단계의 추상화를 포함한다. 가장 낮은 수준인 연관성(보기/관심)은 상관관계로 표현되는 입력 데이터의 정규성 또는 패턴을 감지한다. 중간 단계인 개입(행동)은 인과관계로 표현되는 의도적인 행동의 영향을 예측한다. 가장 높은 수준인 반사실(Counterfactuals)은 왜 특정한 행동이 특정한 영향을 미치는지 그리고 그러한 행동이 없을 때 어떤 일이 일어나는지 설명하는 (세계의 일부) 이론을 구성하는 것을 포함한다.[5]

협회

관찰한 물체가 다른 물체를 관찰할 확률을 변화시킨다면 한 물체는 다른 물체와 연관된다. 예: 치약을 사는 쇼핑객들은 치실도 더 많이 살 것이다. 수학적으로:

치약 구입이 주어질 (치약 구입) 확률. 연관성은 또한 두 사건의 상관관계를 계산하여 측정할 수 있다. 연관성은 인과관계가 없다. 한 사건은 다른 한 사건을 일으킬 수도 있고, 그 반대는 사실일 수도 있고, 두 사건 모두 어떤 제3의 사건(불행한 히게니스트 쉐이크스 쇼핑객에게 그들의 입을 더 잘 대해주도록 하는 것)에 의해 야기될 수도 있다.[5]

개입

이 수준은 사건들 사이의 특정한 인과 관계를 주장한다. 인과관계는 사건들 중 하나에 영향을 미치는 몇몇 행동을 실험적으로 수행함으로써 평가된다. 예: 우리가 치약 가격을 두 배로 올리면, 새로운 구매 확률은 얼마나 될까? 가격 변동 자체가 두 번째 사건(두 상품의 가격을 올리는 관세)에 영향을 미칠 수 있는 다른 이유 때문일 수 있기 때문에 (가격 변동) 이력을 조사해서 인과관계를 성립할 수 없다. 수학적으로:

여기서 do는 실험 개입을 알리는 운영자(가격에 영향을 미침)이다.[5] 운영자는 가능한 한 현실로부터의 변화가 적은 "미니 수술"인 의도된 효과를 창출하는 데 필요한 최소한의 세계 변화를 수행한다고 표시한다.[8]

반사실

반사실적인 최고 수준에는 과거 사건의 대체 버전 또는 동일한 실험 단위에 대해 다른 상황에서 일어날 수 있는 일에 대한 고려가 포함된다. 예를 들어, 만약 가게가 치실 가격을 두 배로 올렸더라면, 치약을 사는 쇼핑객은 여전히 그것을 샀을 확률은 얼마인가?

반사실들은 인과 관계의 존재를 나타낼 수 있다. 반사실적 답변을 할 수 있는 모델은 결과를 예측할 수 있는 정밀한 개입을 허용한다. 극단적으로 그러한 모델은 물리적 법칙으로 받아들여진다(물리학 법칙에서처럼 고정된 물체에 힘을 가하지 않으면 움직이지 않는다는 관성).[5]

인과성

인과 대 상관 관계

통계는 다중 변수들 간의 관계 분석을 중심으로 한다. 전통적으로 이러한 관계는 어떠한 묵시적인 인과관계가 없는 상관관계, 연관관계로 설명된다. 인과관계 모델은 한 변수의 변화가 다른 변수의 변화를 유발하는 인과관계의 개념을 추가함으로써 이 프레임워크를 확장하려고 시도한다.[3]

20세기 인과관계의 정의는 순전히 확률/연관성에 의존했다. 한 사건( )은 다른 사건(Y 의 확률을 높이면 다른 사건이 발생한다고 한다. 수학적으로 이것은 다음과 같이 표현된다.

( )> ( ) X

이러한 정의는 다른 관계( X {\ }및 Y {\가 조건을 충족할 수 있기 때문에 불충분하다. 인과관계는 두 번째 사다리 스텝과 관련이 있다. 연관성은 첫 번째 단계에 있으며 후자에게만 증거를 제공한다.[5]

이후 정의는 배경 요인을 조건화하여 이러한 모호성을 해결하려고 시도하였다. 수학적으로:

( X, K= )> P( K= k) Y

여기서 (는) 배경 변수 집합이고 은(는) 특정 맥락에서 해당 변수의 값을 나타낸다. 그러나 확률을 유일한 기준으로[clarification needed] 삼는 한 필요한 배경 변수 집합은 불확실하다(복수 집합은 확률을 증가시킬 수 있다).[5]

인과관계를 정의하기 위한 다른 시도에는 인과관계(경제학)가 다른 시계열의 사전 값을 사용하여 한 시계열의 미래 값을 예측하는 능력을 측정함으로써 평가될 수 있다는 통계적 가설 검정그레인저 인과관계가 있다.[5]

종류들

명분은 필요하거나, 충분하거나, 기여하거나, 또는 어떤 조합이 될 수 있다.[9]

필요한

xy의 필요한 원인이 되려면 y의 존재는 x의 이전 발생을 의미해야 한다. 그러나 x의 존재는 y가 발생한다는 것을 의미하지는 않는다.[10] 필요한 원인은 "but-for" 원인이라고도 하는데, y발생하지 않았을 것이고 x는 발생했을 것이다.[5]: 261

충분한 원인

xy의 충분한 원인이 되려면 x의 존재는 y의 후속 발생을 의미해야 한다. 그러나 다른 원인 z는 독립적으로 y를 야기할 수 있다. 따라서 y의 존재는 x의 사전 발생을 요구하지 않는다.[10]

유력한 원인

xy의 원인이 되려면 x의 존재는 y의 가능성을 증가시켜야 한다. 확률이 100%이면 x는 대신 충분하다고 한다. 기여하는 원인도 필요할 수 있다.[11]

모델

원인도

인과도는 인과 모형에서 변수들 사이의 인과 관계를 표시하는 방향 그래프다. 원인 다이어그램에는 변수(또는 노드) 집합이 포함된다. 각 노드는 화살표로 인과적 영향을 미치는 하나 이상의 다른 노드에 연결된다. 화살촉은 인과관계 방향을 묘사한다. 예를 들어, 변수 B 을(를) 에서 화살촉과 연결하는 화살표는 의 변경으로 B B관련 확률)에 변화가 발생함을 나타낸다. 경로는 인과화살을 따라가는 두 노드 사이의 그래프를 가로지르는 것이다.[5]

원인도에는 원인 루프 다이어그램, 지시된 반복 그래프, 이시카와 다이어그램 등이 있다.[5]

인과도는 그들에게 알리는 정량적 확률과 무관하다. 그러한 확률의 변경(예: 기술적 개선으로 인한)은 모델에 대한 변경을 요구하지 않는다.[5]

모델 요소

원인 모델은 특정한 성질을 가진 요소들을 가진 형식 구조를 가지고 있다.[5]

접합 패턴

3개 노드의 세 가지 연결 유형은 선형 체인, 분기 포크와 병합 콜라이더다.[5]

체인

체인은 화살이 원인에서 효과로 향하는 직선 연결이다. 이 모델에서 은(는) A}이(가) C C[5]: 113 에 대해 가질 수 있는 변경을 중재한다는 점에서 중재자 역할을 한다.

포크

포크의 경우 하나의 원인이 여러 가지 효과를 가진다. 그 두 가지 효과는 공통적인 원인이 있다. ( 의 특정 값인 경우) {\displaystyle B}[5]: 114 에 대한 조절을 통해 제거할 수 있는 사이에 (비경고) 가상 상관 관계가 존재한다.

"Condition on B는 " 즉, B 를 의미한다.

포크의 정교함은 다음과 같은 혼돈이다.

모델에서 (는) 또한 을(를) 교란자로[clarification needed] 만드는 일반적인 이다.[5]: 114

충돌기

칼라이더에서는 여러 원인이 하나의 결과에 영향을 미친다. 의 특정 값에 대해에 대한 조절을 수행하면 A과( C {\ 사이의 비-경고 음의 상관 관계가 나타나는 경우가 많다 (가) (와) 사이의 상관관계를 설명함에 따라 이러한 부정적인 상관관계를 충돌기 편향과 "폭발" 효과라고 부른다[5]: 115 에 영향을 미치기 위해 의 기여가 필요한 경우 상관관계는 양수일 수 있다[5]: 197

노드 유형

중재자

중재자 노드는 결과에 대한 다른 원인의 영향을 수정한다(단순히 결과에 영향을 미치는 것과는 대조적이다).[5]: 113 를 들어 위의 체인 예에서 은(는) C 결과)에대한 A {\ 의 간접 원인)의 영향을 수정하기 때문에 중재자 역할을 한다.

교란자

교란 노드는 여러 결과에 영향을 미치며, 그것들 사이에 긍정적인 상관관계를 형성한다.[5]: 114

기악 변수

기악 변수는 다음과 같은 변수 중 하나이다.[5]: 246

  • 결과에 대한 경로가 있음.
  • 인과 변수에 대한 다른 경로가 없음.
  • 결과에 직접적인 영향을 미치지 않는다.

회귀 계수는 결과가 혼동되지 않는 한 결과에 대한 기악 변수의 인과 효과의 추정치로 작용할 수 있다. 이러한 방식으로, 기악 변수는 교란자에 대한 데이터 없이 인과 인자를 정량화할 수 있다.[5]: 249

예를 들어 모델 지정: