험악하고 비열해 보이는 이 세계에서 나는 과연 이타적으로 행동하거나 타인과 협력할 필요가 있을까? 이 질문은 오랫동안 나에게 윤리적, 도덕적 범주의 질문이었다. 2012년 MBC에서 벌어진 사상 최장 기간의 170일 파업과 그 이후 수년 동안 이어진 사건과 등장인물들을 대하며, 나는 집요하게 이 질문을 마주할 수밖에 없었다. 이런 현실에서도 나는 이타적이고 협력적으로 살아야 할 이유가 있을까? 만약 그래야만 한다면 그 근거는 무엇일까? 이에 대한 답은 "착하게 살자." 수준의 철학적, 도덕적 근거에서 도출할 무엇이었을 뿐, 과학적 근거에서 나올 성질의 것은 아니었다. 적어도 이 책을 읽기 전까지는.
로버트 액설로드의 <협력의 진화>는 내가 던진 질문과 거의 같은 질문을 던지며 시작된다. "이기적인 개체들로 가득한 세상에서 어떻게 협력이 발생하고 진화할까?"
책은 먼저 그 유명한 "죄수의 딜레마" 게임을 소개한다. 공범 관계에 있는 두 사람, A와 B가 격리된 상태로 검사의 조사를 받고 있다. 만약 두 사람 모두 범행을 부인(협력)하면 둘 다 징역 1년만 받고 끝난다. 그런데 만약 A는 범행을 부인(협력)했는데, B가 자백(배반)한다면? A는 B의 자백이 증거가 돼 징역 5년을 받고, B는 검사에 협력한 대가로 풀려난다. A와 B가 모두 범행을 자백(배반)하면? 정상 참작으로 둘 다 징역 3년이다.
당신이 '죄수의 딜레마'에 빠졌다고 가정하자. 수학적 계산상 최고의 선택은 무조건 '배반'이다. 상대가 배반할지 협력할지 알 수 없는 상황에서, 만약 내가 협력했는데 상대가 배반하면 치러야 할 대가가 너무 크기 때문이다. 그러니까 이기적인 개체들로 가득한 세상에서 나의 최선의 선택은 바로 상대의 '배반'을 가정한 선택, 즉 '배반'이다.
그런데 만약 이 '죄수의 딜레마' 게임이 단 한 번으로 끝나지 않고 오랜 시간 지속해서 계속된다면? 우리가 일생을 통해 마주하는 게임은 이기거나 지거나 둘 중 하나뿐인 제로섬 게임이 아닐 것이다. 지속적으로 사람들과 관계를 맺어야 하는 '반복적' 죄수의 딜레마 게임에 가깝다. 현재의 선택에는 늘 미래의 그림자가 길게 드리워져 있다. 그래도 과연 배반이 최선일까?
1984년 발간된 로버트 액설로드의 <협력의 진화>는 바로 이 반복적 죄수의 딜레마 게임에서 최선의 전략을 찾는 실험 결과를 담은 책이다. 액설로드는 컴퓨터 시뮬레이션을 통해 반복되는 죄수의 딜레마 게임을 개최한다. 참가한 프로그램들은 협력과 배반을 적절한 상황에 맞게 선택하도록 각자 프로그래밍했다. 정치학, 경제학, 사회학, 수학, 생물학을 전공한 다양한 전문가들과 심지어는 중학생도 자기가 짠 전략을 참가시켰다. 여기에 주최 측은 협력과 배반을 무작위 선택하는 전략도 집어넣었다.
점수의 배분은 다음과 같다. 협력-협력=3점, 협력-배반=0점, 배반-협력=5점, 배반-배반=1점. 무조건 배반만 택하는 올디(All-D) 전략부터, 여러 상황을 모두 가정해 선택하도록 짜인 복잡한 프로그램까지 다양한 전략이 경쟁한 결과, 우승자는 팃포탯이라는 이름이 붙은 단순한 전략이었다. 팃포탯은 반복해 실시한 게임 결과, 어떤 상대 전략들과 만나서도 언제나 강력한 것으로 드러났다.
팃포탯의 전략은 매우 단순하다. 그것은 다음과 같은 규칙을 따른다.
1) 상대가 누구든 일단 협력한다.
2) 상대가 착한 녀석(협력적)으로 드러나면 계속 협력한다.
3) 만약 상대가 배반하면 반드시 복수한다. 그러나 복수는 단 한 차례로 끝난다. 다음에 그 녀석을 만나면 다시 협력한다.
과연 이 단순하고 조금은 순진해 보이는 이 전략이 어떻게 우승을 거머쥘 수 있었을까? 답은 그 단순성에 있다. 팃포탯의 전략은 매우 단순하다. 그래서 팃포탯을 만나는 상대 전략은 누구든 팃포탯이 어떤 전략인지를 쉽게 알아볼 수 있다. "내가 시험 삼아 팃포탯을 떠보려고 배반하면 반드시 보복당하는군. 반면 내가 협력하는 한 팃포탯은 계속 협력하는군."
따라서 어떤 전략이든 학습 능력과 융통성을 갖고 있다면 팃포탯에게는 협력하는 것이 유리하다는 교훈을 쉽게 체득할 수 있다. 핵심은 보복에 있다. 기본 전략은 무조건 협력이라는 신사적 전략이지만, 상대가 배반하면 즉각 응징한다. 착해서 물러터지기만 한 전략은 아닌 것이다. 단, 그 보복은 절대 과하지 않다. 단 한 차례만으로 끝난다.
팃포탯 전략의 이 놀라운 능력은 꼭 지능을 갖춘 학습능력이나 선의를 전제하지 않는다. 그런 능력이 없더라도 팃포탯에게 협력하도록 프로그래밍 된 전략은 살아남는 반면, 협력하지 않도록 프로그래밍 된 전략은 자연스럽게 도태될 수밖에 없다. 컴퓨터 프로그램에 지능이나 선의는 없다.
팃포탯은 개별적 대결에서 절대 상대보다 높은 점수를 얻을 수는 없다. 상호 협력을 통해 똑같이 3점을 얻거나, 먼저 배반당한 뒤 보복을 통해 0점과 5점을 주고받을 뿐이다. 그러나 이 대결이 지속해서 반복될 경우 팃포탯은 그 어떤 전략보다도 높은 점수를 얻을 수 있다. 상대를 짓누르는 방식이 아니라 상대의 협력을 끌어내는 방식, 윈-윈 전략을 통해 생태계 전체를 협력 위주로 바꿔내는 놀라운 능력을 발휘한다.
더욱 인상적인 것은 팃포탯이 지배하는 생태계의 안정성이다. 일단 팃포탯 전략을 쓰는 개체들이 우위를 점한 생태계라면 어떤 돌연변이 전략도 그 생태계를 침범할 수 없다. 비신사적인 전략은 팃포탯이 지배적인 생태계에서 도태될 수밖에 없다. 더 나아가 그 반대의 생태계, 즉 배반 위주의 비신사적인 전략이 지배하는 안정적인 생태계에 가장 효율적으로 침범해 생태계를 자신의 규칙대로 바꿀 수 있는 전략 역시 팃포탯이다. 단 이 경우 혼자서는 안된다. 서로 협력할 대상이 존재할 정도의 최소한의 무리를 지어 침범할 경우에만 그렇다.
비신사적(착취적) 전략이 어떤 운명에 처하는지에 관한 좋은 예가 있다. 해링턴이라는 전략은 착취적 전략 가운데 1차 대회에서 유일하게 상위권에 든 전략이다. 그러나 하위전략들을 계속 도태시키는 생태학적 가상 대회를 반복하자, 해링턴은 결국 멸종했다. 더 이상 착취할 만한 하위전략이 남지 않게 됐기 때문이다. 먼저 배반하는 비신사적 전략은 처음에는 전도유망해 보이지만 장기적으로는 자기 성공에 필요한 환경을 스스로 파괴해 결국 몰락한다.
생태학적 자연선택 개념을 도입한 이 반복적 죄수의 딜레마 게임은 35억 년에 걸친 생명의 진화에도 그대로 적용된다. 1960년대까지 진화생물학에서 생명체들 사이의 협력은 주목받는 주제가 아니었다. 그러나 이후 이 분야의 선구자인 윌리엄 해밀턴 같은 학자들에 의해 생태계에서 다양한 공생과 협력 관계가 연구됐고, 박테리아와 같은 단순한 생명체들로 구성된 생태계에서도 협력이 발생하고 진화할 수 있다는 것이 밝혀졌다. 이 경우에도 팃포탯은 절대적으로 유리하다. 협력적인 전략으로 프로그래밍 된 유전자는 선택되고, 협력적이지 않은 전략(박테리아 수준에서라면 단순한 화학반응이겠지만)으로 프로그래밍 된 유전자는 도태된다. 이 아이디어는 이후 리처드 도킨스의 유명한 저작 <이기적 유전자> 개정판에서 차용된다.
성공은 상대를 짓누르고 이기는 데 있는 것이 아니라, 상대의 협력을 이끌어내는 데 있다는 이 단순한 명제. 이 책이 나에게 갖는 의미는 그 명제의 근거를, 윤리와 도덕에서가 아니라, 정교한 수학적 확률 계산과 반복적 실험을 통해 과학적으로 증명했다는 데 있다.
윤리적 실천 문제를 과학에 물어볼 수 있을까? 이제 나의 답은 '그렇다'이다.
'책' 카테고리의 다른 글
과학은 인간을 어떻게 위로할 수 있는가? (2) | 2015.10.23 |
---|---|
나의 비천한 기원을 찾아 - 에덴의 용, 칼 세이건 (0) | 2015.04.28 |
공산당 선언을 다시 읽다. (0) | 2015.03.19 |
민주주의란 무엇인가? (0) | 2015.03.19 |
<풀하우스> 스티븐 제이 굴드 (0) | 2015.03.19 |