위의 문장은 기독교라는 context 를 떠나서 다음과 같이 생각해 볼 수도 있다.
이 세상에서 발생하는 현상들이 순수하게 확률적으로 일어난다고 가정한다. 그 외에 아무런 다른 법칙을 가정하지 않는다. 현실세계에서 물이 위로 흐르는 일은 없다. 이것은 우리가 중력의 법칙을 알고 있기 때문에 자신있게 말할 수 있는 것이다. 하지만, 위에서 가정한 모델에서는 다만 확률이 아주 낮을 뿐이지, 물이 아래서 위로도 흐를 수 있다고 보는 것이다.
이것은 단순히 허무맹랑한 가정만은 아니다. 미시세계나 열역학적인 관점에서는 이 모델이 더 자연계의 현상을 설득력있게 해석하기 때문이다. 또한 이것은 베이지안통계학, Bayesian framework 의 근본적인 철학과도 관련이 있는데, 베이지안통계학에서는 실제로 일어나지 않았던 사건들에 대해서도, prior distribution 을 조절함으로써, 아주 적은 확률로 일어났다고 가능성을 부여한다.
베이즈정리에서 보여진 바와 같이
P(X,Y) P(Y|X)P(X) P(X|Y) = ----------- = ----------------- P(Y) P(Y)
P(X) 는 prior distribution, P(Y|X) 는 likelihood, P(X|Y) 는 posterior distribution 이다. X 를 주사위 6이 나오는 확률, 모수(parameter)라 하고, Y 를 10번 주사위를 던졌을때, 6이 한번도 안 나온 사건이라 하자. 따라서 P(X) 는 주사위 6이 나올 확률에 대한 확률 분포이고, P(Y|X)는 X 라는 모수(parameter) 하에서 Y 라는 사건이 일어날 likelihood 이며, P(X|Y) 는 10번 주사위를 던졌을때, 6이 한번도 안 나온 Y 라는 사건이 일어났을때, 주사위 6이 나오는 확률 X 에 대한 확률분포이다.
우리가 P(Y|X), 즉 likelihood 를 maximize 하는 X 값을 찾고자 한다면, 그것은 바로 Maximum Likelihood Estimation(최대우도추정)이 된다. 이 경우에는 X=0 에서 최대화되고, 이것이 Classical Statistics(고전적인 통계학)이자, 고전적인 과학적 세계관이었다.
반면에 우리가 posterior distribution P(X|Y) 를 최대화시키는 X 값을 찾고자 한다면(MAP Estimation, Maximum a Posteriori), 그것이 바로 Bayesian statistics 이고, 여기에서 P(Y) 는 X 에 따라 변하지 않는 상수에 해당하므로 제거하면, P(Y|X)*P(X) 를 최대화시키는 것이 목표가 된다.
이것의 함의를 생각해보면, prior distribution 을 어떻게 설정해 주는가에 따라, 비록 주사위를 10번 던져서 6이 한번도 안 나왔지만, 앞으로는 아주 적은 확률이지만 나올 수 있다는 것이고, 물을 관찰해도 위로는 흐르지 않았지만, 그렇다고 절대로 안 흐른다고는 하지 않는 것이다.
물론 data 가 많아지면, 다시 말해서, 주사위를 계속 던져보던지, 물이 어떻게 흐르는지 계속 관찰해 보면, MAP 은 ML 로 수렴된다. 하지만, 어쨌든 가능성을 완전히 닫아 놓은 것과, 조금이라도 열어 둔 것은 차이가 있는 것이고, 특히 data 가 적을 때 매우 유용하다.
여기서 또 하나의 가정을 하자. 어떤 사건이 발생할 때, 거기에 영향을 미치는 요인들이 있을 것이다. 물론 당연히 그 일이 일어나기를 기대하는 사람도 하나의 변수로 들어가야 할 것이다. 굳이 "불확정성의 원리"를 들지 않더라도, 인간과 자연 사이의 상호 작용이 없다는 것은 전혀 말이 되지 않기 때문이다. 따라서 우리는 "주관"과 "객관"이 독립적이지 않고 종속되어 있을 때의 조건부 확률로 생각할 수 있으며, P(객관|주관)P(주관) 의 posterior 를 maximize 시키는 "주관" 을 고를 수가 있을 것이다.
여기서의 논리의 비약은 이해하기 힘듭니다. 여기와 같은 방식을 따르면 "속옷을 뒤집어 입어라, 그러면 시험에 합격할 것이다"와 같은 주장도 증명할 수 있고, 심지어 "믿는 도끼에 발등찍힐 것이다" 라는 정 반대의 주장을 증명하는 것도 간단합니다. 따라서 이 페이지의 대부분을 차지하는 수학에 관련된 듯한 긴 설명은 결론과 전혀 관계 없는 것이 아닌가요? 실제로 하고싶으신 이야기는 이 시점 아래부터 시작인듯 하고, 통계와는 아무런 관계가 없는 것 같습니다만. --아무개
길게 설명했지만, 결론은 모든 진리가 그렇듯이 간단하고, 아름답다. 그럴 가능성도 물론 전혀 없지는 않을 겁니다. 하지만 위에서 얘기한 것들은, 어떤 사실들이 증명된다는 것이 아니라 가능성이 있다는 것입니다. 그리고 예수님이 얘기한 것도 바로 그것이라고 생각할 수 있습니다. "Possible" 이라는 건 반드시 된다고 얘기한 것은 아니라고 볼 수 있죠. 하지만 그래도 가능성이 조금이라도 있는 것과 전혀 없는 것의 차이입니다. 또한 그것이 고전적 통계학의 분야인 ML 로 model 을 만들어 놓은 것과, Bayesian 으로 만들어 놓은 것의 차이죠. 통계와 수학 얘기는 그것 때문에 나온 것입니다. 하고 싶었던 얘기가 밑에 있는 것은 맞지만, 위의 내용과 관련이 전혀 없다고 단정하는 건 역시 가능성을 0로 두는 것이기 때문에, 아쉬움이 남겼죠. --지상은
믿는다는 것은, 결국 prior knowlege, P(X)를 조절하는 것이다. 우리가 그것을 어떻게 조절하는가에 따라, 모든 것이 가능해진다. 왜냐하면, 베이지안통계학에서 prior distribution 이 바로 그 역할을 하는 것이기 때문이다.
다시 말해서, 인간은 어느 정도까지는 Generative 하고 Creative 하다. 이것을 동양학에서는 스스로의 "運"을 가진다고 표현한다. 설사 신을 믿지 않는다고 하더라도, 위 가정들에 의한 논거가 사실이라면, 이것은 제대로 작동할 것이다. 믿음을 가질 때, 확신을 가질 때, 그로 인해서 어떤 것을 이루어 낼 때, 그것은 누군가 전지전능한 존재가 대행해 주는 것이 아니라, 스스로 생성해 내는 것이라 볼 수 있는 것이다.