뒤로가기
스페셜뉴스
[문학이 사랑한 통계⑬] 로저 멕시코와 함께하는 확률론 강의
2019. 01. 03 by 현우진 기자 hwjin0216@naver.com
폭격기는 과연 한 번 폭격했던 곳에 다시 폭탄을 떨어트릴까?
폭격기는 과연 한 번 폭격했던 곳에 다시 폭탄을 떨어트릴까?

[시사위크=현우진 기자] 토머스 핀천은 어느 모로 보나 독특한 인물이다. 핀천은 소설가로서는 드물게 대학에서 물리학을 전공했으며, 훗날 영어학으로 전공을 바꾼 후에도 과학에 대한 관심을 끊지 않았다. 그는 작가로 등단하기 전까지 보잉사에서 테크니컬 라이터로 근무하면서 전문 기술용어들을 일반인도 이해하기 쉽게 바꾸는 업무를 맡았다. 말하자면 인문학과 자연과학의 경계선에 서 있는 작가인 셈이다. 

핀천의 소설들은 작가의 성향을 반영해 역사와 음악부터 과학·수학까지 매우 다양한 주제들을 다루고 있다. 2차 세계대전 당시의 런던을 배경으로 한 <중력의 무지개>는 그 중에서도 특히 수리과학에 대한 애착이 깊은 핀천의 대표작이다. 소설의 주요 등장인물이자 때로는 화자 역할도 맡는 로저 멕시코는 독일 공군이 떨어트리는 V2폭탄의 낙하 위치를 파악하는 임무를 맡은 통계학자며, 이 때문에 <중력의 무지개> 곳곳에서는 푸아송분포와 몬테카를로, 시그마, 멱급수 같은 통계용어들이 등장한다.

2012년에 영국에서 재출간된 '중력의 무지개' 표지. /토머스 핀천 공식 홈페이지
2012년에 영국에서 재출간된 '중력의 무지개' 표지. /토머스 핀천 공식 홈페이지

◇ 푸아송검정의 결론은 ‘안전지대 없음’

로저는 그녀에게 V폭탄의 통계에 대해 애써 설명했다. 천사의 눈에나 보일 영국 지도 안의 분포와 이 아래 인간의 눈에 보이는, 그들 자신이 살아남을 기회의 차이에 대해. 그녀는 거의 알아차렸다. 그녀는 푸아송 공식도 거의 이해하지만 그 두 가지를 조합하진 못한다.-그녀 자신의 일상 속 굳게 자리 잡은 평온과 이 건조한 숫자들이 같은 시간에 존재하는 것이란 것을 파악할 순 없다. 퍼즐 조각들은 항상 부족하거나 넘쳐난다.
“왜 천사들을 위한 공식밖엔 없는 거야, 로저. 우리가 뭔가 할 수는 없는 거야? 이 밑에서? 우리를 위한 공식은 만들 수 없어? 좀 더 안전한 장소를 찾을 수 있도록 해 주는 그런 어떤 것.”
“왜 내 주위엔,” 오늘도 여전히 참으로 이해심 많은 그 모습, “온통 통계엔 까막눈인 사람들밖에 없는 거지? 내 사랑, 폭격의 평균확률밀도가 일정한 이상 그런 건 불가능해. 포인츠맨은 그것조차 이해 못하지.”
교과서의 푸아송 공식으로 예측되는 분포 그대로, 정말로 로켓들은 런던 전역에 떨어진다.
-토머스 핀천, 중력의 무지개, 이상국 옮김, 새물결

런던 대공습에 나선 독일의 폭격기 조종사들은 과연 폭탄을 떨어트릴 때 분명한 목표물을 갖고 있었을까. 이 주제에 대해선 실제로 연구가 진행된 바 있다. 2차 세계대전 당시 영국 통계학자 R.D.클라크는 런던 남부를 576개(24*24) 구역으로 나누고, 각각의 구역에 떨어진 폭탄의 개수를 세는 방식으로 통계검정을 진행했다. 만약 독일 공군이 특별한 타깃 없이 무작위로 폭탄을 떨어트렸다면(평균확률밀도가 일정하다면) 구역별로 폭탄이 떨어진 횟수의 분포는 푸아송분포를 따를 것이다.

연구기간 동안 독일 공군이 떨어트린 폭탄의 개수가 536개니 구역 1곳에 떨어진 폭탄의 평균개수는 0.93(537 나누기 576)이다. 푸아송분포의 공식에 평균값 0.93을 대입하면, 사건이 한 번도 일어나지 않을 확률은 약 39.36%로 계산된다. 이는 576개 구역 중 폭탄이 한 번도 떨어지지 않은 구역 개수의 기댓값은 226.74곳(0.3936 곱하기 576)이라는 뜻이다. 같은 방식으로 다른 확률도 계산해보면 폭탄이 1번 떨어진 구역 수의 기댓값은 211.39곳, 2번 떨어진 구역 수의 기댓값은 98.54곳이 된다.

클라크가 수집한 자료에 따르면 576개 구역 중 실제로 한 번도 폭격을 받지 않은 구역은 229곳이었으며 단 한 번 받은 구역은 211곳, 2개의 폭탄이 떨어진 구역은 93곳이었다. 푸아송분포로 계산한 기댓값과 거의 같은 수치다. 폭탄이 3번 떨어진 구역(기댓값 30.62, 실측치 35)와 4번 떨어진 구역의 개수(기댓값 7.14, 실측치 7) 또한 확률분포와 매우 유사한 결과가 나왔다. 이것은 무엇을 의미할까? 독일 공군은 런던 시내에 무차별 폭격을 퍼부었으며, 어느 구역이든 다음번에 폭탄이 떨어질 확률은 같기 때문에 ‘좀 더 안전한 장소’는 없다는 것이다.

“앞으로 폭격 받을 가능성은 모든 구역이 똑같아. 집중 포격을 받는 곳은 없어. 평균확률밀도는 동일해.”
이를 반증할 만한 것은 지도 위엔 없다. 고전적인 푸아송 분포만 보일 뿐. 사각형 격자 사이로 깔끔하게, 소리 없이 걸러져, 마땅히 그래야 하듯, 예측된 그대로의 모양을 이루며…….
“그러나 이미 폭격을 몇 번이나 받은 곳도 있잖아. 그러니까-”
“미안하지만 그게 바로 몬테카를로 오류라는 거야. 특정한 지역에 얼마나 많이 떨어졌든 미래의 확률은 차이가 없어. 로켓들은 각자, 서로와 아무 관계없이 떨어져. 폭탄은 개가 아니야. 관계도 모르고, 기억도 없어. 적응이란 것도 없어.”

도박으로 유명한 모나코의 도시 몬테카를로에서 이름을 딴 ‘몬테카를로 시뮬레이션’은 반복시행을 통해 확률을 추정해나가는 작업을 가리킨다. 한편 ‘몬테카를로 오류’, 혹은 ‘도박사의 오류’라고 불리는 같은 행동을 여러 번 반복할 때 사람들이 흔히 일으키는 통계적 착오를 말한다. 파블로프가 훈련시킨 개들은 종소리를 들으면 식사를 떠올리지만, 동전은 이전번에 앞면이 나왔는지 뒷면이 나왔는지 기억하지 못한다(동전 자체에 문제가 있지 않다면). 일평생 번개를 일곱 번이나 맞은 사람이 존재하는 것과 마찬가지로 폭탄도 한 번 떨어진 곳에 다시 떨어지지 말란 법은 없다. 클라크의 연구에서 5번이나 폭탄이 떨어진 것으로 나타났던 구역 역시 다음번에 폭탄이 떨어질 확률은 다른 구역들과 같다.

런던 대공습 당시 독일 공군이 폭탄을 투하한 장소를 표시한 지도. /'http://bombsight.org'
런던 대공습 당시 독일 공군이 폭탄을 투하한 장소를 표시한 지도. /'http://bombsight.org'

◇ ‘별종’의 또 다른 표현, N시그마

그가 심리전부의 다른 사람들에게 다가가지 못하는 것은 당연한 일이었다. 그와 같이 지하 회랑을 차지하고 있지만, 확실히 3-시그마에 속할 만한 희귀한 인간들. 맙소사, 너라면 안 그러겠어?
그들의 그토록 명백한 한 가지 욕구, 너무도 뻔한 그 욕구에 그는 짜증이 난다. 그래, 그의 욕구이기도 하지. 하지만 카이 제곱식의 바로 뒤편에서, 그리고 제너 카드가 뒤집히는 사이사이 그 틈에서, 영매가 굵고 힘겨운 목소리로 말을 이어 가는 그 사이의 침묵 속에서, 삶의 유한한 힘이 옆구리를 찔러 대고 있는데, 어떻게 과학을 기반으로 ‘정신적인’ 것들을 설명할까?

통계학에서 시그마(σ)는 하나의 값이 평균으로부터 얼마나 멀리 떨어져 있는지를 뜻하는 기호다. 누군가가 평균에서 1시그마만큼 떨어져 있다면 그는 사회 전체적으로 볼 때 68.27%만큼의 주류에 속하는 사람인데, 양극단으로 갈수록 확률이 급격히 낮아지는 정규분포의 특성상 평균에서 멀어질수록 시그마의 값은 급격히 높아진다. 2시그마는 95.45%, 3시그마는 99.73%를 포함하는 범위다. 즉 ‘3시그마에 속할 만한 인간’은 한 사회에서 0.27%(370명 중 한 명)에 속하는 독특한 사람들(좋은 뜻으로든 나쁜 뜻으로든)을 의미하는 표현이다.

◇ 멱법칙이 지배하는 세계

실제로 일이 터지면, 우리는 그것을 ‘운이 없는 것’이라 하고 더 이상 파고들지 않는다. 아니면 우리는 이미 설득당한 것. 운이란 것이 거의 먹히지 않는 단계가 실제로 존재한다. 그러나 로저 멕시코와 같은 고용인들에겐 그것은 음악, 장대함이 담겨 있지 않다고 할 수 없는 음악이다. 이 멱급수에서 각 항들은 네모칸 안 폭탄 투하 수에 따라 번호가 매겨져 있으니, 그 푸아송 분포는 누구도 피해 달아날 수 없는 이 절멸의 사건들뿐 아니라, 기병대의 사고, 사망자 수, 방사능 분해, 매년 발생할 전쟁의 수까지 지배하고…….

토머스 핀천이 무한급수의 일종인 멱급수(power series)를 언급한 이유는 무엇일까 .멱급수를 이루는 것은 멱함수(거듭제곱의 지수를 고정하고 밑을 변수로 두는 함수)들이며, 이 멱함수들의 상관관계를 일컫는 멱함수 법칙, 일명 ‘멱법칙’은 <중력의 무지개>에서 언급된 것처럼 각종 사회현상들을 지배하는 법칙으로 주목받고 있다. 특정한 사건이 발생할 확률은 그 사건이 갖는 가치의 영향력에 반비례한다는 ‘멱법칙’은 물리학과 천문학을 비롯한 자연법칙들부터 경제·금융·컴퓨터 등 인류가 만든 시스템들, 그리고 인구론과 생물의 분포, 언어의 구성과 같은 생명체의 활동까지, 학문으로서 연구되고 있는 거의 모든 분야에서 관측된다.

인문사회 분야에서 멱법칙을 따르는 것으로 나타난 현상들은 다음과 같다. 미국을 비롯한 서구권 국가들의 성씨 분포(한국 성씨는 지수분포를 따른다), 도시별 인구수 분포, 허먼 멜빌의 <모비 딕>에 사용된 단어들의 출현 빈도, 일별 전화통화량, 그리고 전쟁 사망률. 1816년부터 1980년까지 일어난 119번의 전쟁들을 분석한 1982년의 연구에 따르면, 각각의 전쟁들이 기록한 ‘인구 1만명당 사망률’의 분포는 멱급수를 따른다.

로저 멕시코의 최대 관심사였던 폭탄 테러도 예외는 아니다. 마이애미 대학의 닐 존슨 교수 연구팀이 지난 2009년 발표한 연구결과에 따르면, 폭력집단(IS, 백인 우월주의 단체 등)의 테러 빈도와 사망자 수 역시 멱법칙을 따른다.