뒤로가기
스페셜뉴스
[문학이 사랑한 통계②] 진짜 이야기를 만드는 가짜 숫자들
2018. 09. 10 by 현우진 기자 hwjin0216@naver.com
공상과학소설은 통계학이 활용되기 좋은 무대다. <언스플래쉬>

[시사위크=현우진 기자] 새로운 세계를 만드는 공상과학(SF)소설 작가들은 어떤 방식으로든 자신이 창조한 세계를 독자에게 설명해줘야 하는 의무가 있다. 현실을 풍자하기 위해 디스토피아를 그린 소설가들도 마찬가지다.

대학원생이 자신의 논문을 뒷받침하기 위해 통계자료를 수집하는 것처럼, 작가들도 몇 개의 숫자를 인용함으로서 이야기에 생명력을 불어넣곤 한다. 물론 통계자료 역시 모두 만들어낸 것이다. 그럴싸한 출처들과 함께 등장하는 숫자들은 이 가짜 이야기들을 보다 현실적으로 만들어줄 수 있다.

◇ 도롱뇽부터 빅 브라더까지

체코가 자랑하는 문학가 카렐 차페크는 인간과 다른 존재의 대립이라는 주제에 각별한 관심을 보였다. 희곡 <R.U.R.>에서는 로봇이, 소설 <도롱뇽과의 전쟁>에서는 도롱뇽이 그 대상이다.

<도롱뇽과의 전쟁>은 먼 바다를 항해하던 선장이 우연히 지능이 있는 도롱뇽을 발견하면서 시작된다. 도롱뇽이 상품성이 있다고 판단한 거대 신디케이트는 이들의 생산·유통·판매를 전담하고 머지않아 도롱뇽들은 완전히 인간 사회에 편입된다. 차페크는 1차 세계대전 후 ‘도롱뇽 경제’를 통해 황금기를 맞은 유럽을 묘사하기 위해 신문 기사와 사설·잡지·서적 등 다양한 출판물 양식을 활용했는데, 통계 인용 역시 자주 사용됐다. 소설 곳곳에서는 “지난 석 달 동안 도롱뇽 7,000만마리가 팔렸다”거나 “포획된 도롱뇽 가운데 운송 과정에서 살아남는 개체는 대략 25~30%뿐이다”는 표현들을 찾아볼 수 있다.

<그들은 이제는 도롱뇽들이 단순히 노동자 집단일 뿐 아니라 끊임없이 성장하는 거대한 소비자 집단이기도 하다는 사실을 이유로 내세웠다. 그러면서 최근 금속공업(노동 연장, 기기, 도롱뇽들의 금속 우상들), 무기, 화학(수중 폭발물), 제지산업(도롱뇽 교과서), 시멘트, 목재, 합성 식품(도롱뇽 식품)을 비롯해 다양한 산업 분야에서의 고용률이 전례 없는 수치에 도달했다고 설명했다. 선박 운송량도 27퍼센트나 증가했고, 석탄량은 18.6% 증가했다. 간접적으로 인간 고용도 증가했고 경기도 호황을 맞았다.>
-카렐 차페크, 도롱뇽과의 전쟁, 김선형 옮김, 열린책들

한편 조지 오웰은 그가 극도로 혐오한 전체주의 사회를 고발하는데 통계라는 소재를 활용했다. ‘사회 통제를 위한 통계 조작’이라는 소재는 그의 여러 작품에서 발견된다.

<동물농장>과 <1984년>의 작가 조지 오웰. <뉴시스/AP>

<일요일 아침이면 스퀼러는 기다란 종이를 앞발로 받쳐 들고는 각종 식량 생산이 경우에 따라 200, 300 혹은 500퍼센트까지 증가했다는 것을 입증하는 통계 수치를 낭독하곤 했다. 동물들은 반란 전의 상태가 어땠는지 정확히 기억하지 못했기 때문에 스퀼러의 말을 믿지 않을 이유가 없었다.>
-동물농장, 조지 오웰, 김기혁 옮김, 문학동네

<그가 받아 온 메시지들은 이런저런 이유로 해서 변경, 공식적 용어로 말하면 수정될 필요가 있는 논문이나 뉴스 기사와 같은 것들이었다. (중략) 12월 19일자 타임스에 제9차 3개년 계획의 6분기에 해당되는 1983년의 4분기 동안의 다양한 소비품 생산량을 공식적으로 발표했다. 그런데 오늘자 신문에 실제 생산량에 대한 보고가 실렸는데 예전에 실린 내용과 수치가 완전히 딴판이었다. 윈스턴이 해야 할 일은 처음 숫자를 나중 숫자와 일치하도록 수정하는 것이었다.>
-1984년, 조지 오웰, 박경서 옮김, 열린책들

‘외부 당원’으로서 영사(영국 사회주의)를 위해 일하는 윈스턴 스미스의 역할은 언론보도를 통제하는 것이다. 그는 매일 상부로부터 그날그날 수정해야할 기록물에 대한 지시를 받는다. 목표치와 예상치, 결과 값이 모두 수정 대상이다 보니 나중에는 무엇이 진실인지 알 수 없는 지경까지 이른다.

<그러나 그는 풍부부의 숫자를 재조정하면서 이 일은 사실 위조라고 볼 수 없다고 생각했다. 하나의 허튼소리를 또 다른 허튼소리로 바꿔 놓는 것일 뿐이었다. 자신이 취급하고 있는 자료들 대부분은 실제 세계의 어떤 것과도 상관없으며, 심지어 노골적인 거짓말만큼도 관계가 없다. (중략) 예를 들자면 풍부부는 4분기의 구두 생산량을 1억4천5백만 켤레로 예상했었다. 실제 생산량은 6천2백만 켤레에 불과했다. 하지만 윈스턴은 예상을 수정할 때 할당량이 초과 달성되었다는 상투적인 주장을 하기 위해 예상 생산량을 5천7백만 켤레로 낮추어 기록했다. 그렇다고 6천2백만이라는 숫자가 5천7백만이나 1억4천5백만이라는 숫자보다 진실에 더 가까운 것도 아니다. 어쩌면 한 켤레도 생산되지 않았을지도 모를 일이었다.>

◇ 통계로 미래를 예상할 수 있을까

통계적 결정론은 SF소설계의 단골 소재 중 하나다. 현재의 데이터를 바탕으로 미래의 일을 예측하는 것은 가능할까? 바꿔 말하면, 미래의 일들은 현재의 조건에 따라 결정되는 것일까? 뉴턴의 기계론적 세계관과 ‘라플라스의 악마’가 부풀린 이 공상은 20세기 초 양자역학과 불확정성 원리가 등장하면서 완전히 폐기됐다. 우주에 있는 모든 원자의 정확한 위치와 운동량을 아는 것은 불가능하기 때문이다.

SF소설계의 거장인 아이작 아시모프는 자신의 대표작 <파운데이션>에서 이 질문을 문학으로 만들었다. 수학자 해리 셀던은 자신이 주창한 ‘심리역사학’을 바탕으로 미래를 예언하는 방정식을 만들고, 이로 인해 은하계가 3만년의 암흑기를 맞을 운명임을 알게 된다. 소설의 제목인 ‘파운데이션’은 셀던이 은하계의 암흑기를 1000년으로 줄이기 위해 설립한 단체의 이름이다. 천재 한 명이 미래의 위기를 예측하고 대비책을 마련해둔다는 설정은 수많은 작가들에게 영감을 줬으며 이들은 <파운데이션>의 설정을 답습하거나 결말을 반전시키는 방식으로 자신의 답을 내놨다.

쥬라기 공원의 관리자들은 공룡들의 번식을 예상하지 못했다. 자연에는 통계를 바탕으로 한 계획을 깨트리는 변수들이 있기 때문이다. <픽사베이>

보다 현대적인 과학 이론으로 무장한 마이클 크라이튼의 <쥬라기 공원>은 <파운데이션>의 안티테제라고 불릴 만하다. 크라이튼이 쓴 원작소설은 스티븐 스필버그가 각색한 영화보다 훨씬 많은 시간을 수학 이론에 할애한다. 소설의 전반부 대부분은 수학자이자 통계학자인 이안 말콤의 대사로 뒤덮여있다.

쥬라기 공원의 관리자는 자신들이 공원 내 공룡들의 생태를 완벽하게 파악하고 있다고 설명한다. 그가 말콤에게 보여준 프로콤프소그나투스 58마리의 몸무게 분포도는 매우 이상적인 푸아송 분포(평균값 근처에 많은 개체들이 모여 있고 양 극단으로 갈수록 빈도가 적어지는 구조)를 그리고 있다. 관리자는 이것을 공원이 공룡들을 완벽하게 통제하고 있다는 증거로 여기지만, 말콤은 동의하지 않는다. 카오스 이론을 연구하는 말콤은 공룡 생태계에서 일어나는 자연발생적 변수들이 공원 설립자들의 의도를 망가트릴 것이라고 주장하는데, 이는 <쥬라기 공원> 전체를 가로지르는 테마인 “생명은 스스로 살 길을 찾는다(Life finds a way)”와 맥락을 같이한다.

<“잠깐만 생각해 보면 그 멋있는 정상적 분포도가 사실은 이 섬의 가장 걱정스러운 모습을 보여준다는 걸 알 수 있는데도 말이에요.”

“걱정스럽다고요?”

(중략)

“그건 ‘정상적인 생물학적 분포도’이기 때문입니다. 쥬라기 공원의 동물들은 정상적인 생물학적 표본이 될 수 없습니다. 쥬라기 공원은 현실 세계가 아니거든요. 쥬라기 공원은 자연 세계를 모방만 하고 있을 뿐, 실제로는 통제된 세계를 만들려는 시도예요. 그런 의미에서 이곳은 진짜 공원이죠.”>
-마이클 크라이튼, 쥬라기 공원, 정영목 옮김, 김영사

쥬라기 공원의 관리자들은 공룡의 몸무게를 일정 시차를 두고 3번에 걸쳐 조사했다. 따라서 확률밀도함수 그래프에서도 3개의 축이 나타나야 한다. 그러나 실제로는 축이 하나뿐이며, 따라서 통제되지 않은 요소가 프로콤프소그나투스의 몸무게 통계에 영향을 미쳤다는 해석이 가능하다. 모두 암컷으로 구성될 예정이었던 공룡들이 어느 순간 성 변이를 일으켜 알을 낳는 것 말이다.

크라이튼은 아마도 하버드 대학에서 메디컬 스쿨을 다닐 당시에 푸아송 분포에 대해 배웠을 것이다. 수십·수백개의 표본이 필요한 정규분포와 달리 푸아송분포는 빈도수가 적은 사건에도 대입할 수 있으며, 이 때문에 의학통계에서 자주 활용된다.