본문 바로가기

강의·지식/경제학원론

[경제학원론] 게임이론·죄수의 딜레마·내쉬균형

반응형

이번에 정리할 부분은 바로 게임이론이다. 경제학에서의 게임이 특별히 다른 의미를 갖는 건 아니고, 쉽게 떠올릴 수 있는 것들―스포츠 경기나 고스톱, 포커, 바둑, 장기, 동종 기업 간의 경쟁, MT 장소 선정을 두고 벌이는 갑론을박 등등이 다 게임이다. 게임이론 부분에서 중요한 건 딱 두 가지. 게임의 균형과 모형이다.

 

[경제학원론] 게임이론·죄수의 딜레마·내쉬균형

 

일단 게임을 구성하는 기본 요소가 뭔지 간단하게 알아보자. 가장 먼저 필요한 건 경기자(player)다. 당연히 경기자가 없으면 게임이 진행될 수 없으니까. 꼭 개인이 경기자가 되는 건 아니고 기업이나 국가 등도 경기자가 될 수 있다. 게임마다 경기자 수가 다르긴 하지만 가장 흔한 경우는 경기자가 두 명일 때다. 이 경기자들은 게임에서 자신이 어떤 행동을 할지에 대한 전략(strategy)을 갖고 있어야 하며, 게임 결과에 따라 각 경기자에게는 보수(payoff)가 주어진다. 이렇게 경기자, 전략, 보수 셋이 게임의 기본 골격을 이루는 요소들이다.

 

한편 경기자들에게 돌아간 보수의 합이 0인 게임을 영합게임, 영어로는 우리에게 익숙한 ‘zero-sum game'이라고 한다. 앞서 예로 들었던 고스톱이나 포커 같은 도박들은 모두 영합게임에 해당한다. 하지만 경제생활에서는 다르다. 어떤 판매자와 구매자가 만나 상품의 판매 조건을 흥정하는 것도 게임으로 본다면, 여기서 나오는 보수의 합은 0보다 크다. 교환에 참여하는 모든 경제주체는 그로부터 이득을 얻을 수 있으니까.

 

이 정도로 해두고, 빠르게 넘어가자. 핵심적인 부분만 정리한다. 게임의 균형으로는 우월전략균형과 내쉬균형, 게임의 모형으로는 우월전략균형의 대표적 사례인 죄수의 딜레마(용의자의 딜레마) 모형을 살펴본다.

 

죄수의 딜레마는 모르는 사람이 거의 없을 것 같다. 다들 한 번쯤은 들어 본 이야기다. 공범 두 사람이 있고 각각을 다른 방에 집어넣는다. 두 사람에게 같은 제안을 던진다.

 

 

“거 느그들이 했다는 물증 찾는 건 시간 문제여. 어차피 계속 버팅겨 봤자 증거 나오니까 순순히 자백혀. 저쪽 놈이 자백했는디 네가 안 했다 그러면 저쪽 놈은 풀어주고 너는 10년형을 먹일 거여. 반대로 네가 자백하고 저쪽에서 지가 안 했다 그러면 널 풀어주고 저쪽 놈한테 10년형을 먹일 거고. 둘 다 안 했다고 버팅기면, 늬들 이번 거 말고 또 사고쳐놓은 거, 그걸로 일단 1년 처넣어 놓을 거고. 둘 다 자백하면 최대한 깎아서 3년만 줄 테니까, 어때, 자백할 텨?”

 

이게 게임이론에 등장하는 죄수의 딜레마 모형이다. 그럼 이게 왜 우월전략균형의 대표 사례인지, 우월전략균형이 대체 뭔지 알아보자.

 

[경제학원론] 게임이론·죄수의 딜레마·내쉬균형

 

스투데오와 찬디르가 공범이라고 치자. 아래의 표는 위의 말을 간단히 정리해둔 것이다. 칸 안에는 죄수의 딜레마 게임에 따른 두 사람의 보수가 적혀 있다. 이렇게 보수들을 모아 정리해둔 걸 보수행렬이라고 부르는데, 더 간단히 하면 오른쪽과 같다.

 

자, 이런 상황에서 찬디르는 어떤 결정을 내려야 할까…… 를 생각하기 전에 우월전략이 뭔지부터 보자. 우월전략이란 상대방이 어떤 전략을 선택하느냐에 관계없이 자신에게 항상 유리한 결과를 가져다주는 전략을 말한다. 포인트는 상대의 전략에 관계없다는 것. 내가 이걸 선택하면 네가 뭘 갈아엎고 지지고 볶든 내가 더 유리하다! 뭐 이런 전략이다.

 

보수행렬을 보자. 먼저 스투데오가 부인하는 경우를 가정해 보자. 찬디르가 어떤 선택을 하는 게 유리할까? 부인하면 1년형, 자백하면 방면이니 당연히 자백하는 편이 유리하다. 그럼 스투데오가 자백하는 경우라면? 찬디르가 부인하면 10년형, 자백하면 3년형이다. 어떤 경우에도 자백하는 쪽이 더 유리한 결과를 가져온다. 이 경우 찬디르에게는 자백이 우월전략이다. 반대로 스투데오는 어떨까? 같은 원리로 찬디르의 부인과 자백을 가정하고 유리한 쪽이 어딘지를 따져 보면, 찬디르가 부인하든 자백하든 스투데오가 자백하는 편이 항상 더 유리한 결과를 가져온다. 즉 스투데오에게도 역시 자백이 우월전략이다.

 

어라? 두 경기자의 우월전략이 모두 자백하는 쪽이다. 지금까지의 셈법대로라면 둘 다 자백할 가능성이 가장 높다. 여기서 정의 하나 더. 게임에서 ‘균형(equilibrium)’이란 실현될 가능성이 높은 결과를 말하는데, 따라서 죄수의 딜레마 게임의 균형은 두 경기자 모두 자백하는 것이 된다. 이는 두 경기자가 모두 우월전략을 사용해 나타난 균형이므로 우월전략균형이라고 부른다.

 

 

이 죄수의 딜레마 모형은 세 가지 의의를 지닌다. 일단 앞서 말했듯 이 모형은 우월전략균형의 대표 사례다. 또 이 모형에서 시장 실패가 발생한다는 점을 알 수 있는데, 보수행렬에서 두 사람의 이득(사회 전체의 이득이라고 하자)이 극대화되는 쌍은 둘 다 부인할 때 나오는 (1, 1)이다. 그러나 두 사람이 각자 사익을 추구한 결과 (3, 3)의 보수를 얻게 되었다. 보이지 않는 손이 작동하지 않은 셈이다.

 

마지막으로 죄수의 딜레마 모형을 카르텔과 공공재에 적용할 수 있는데, 이건 나중에 시간이 나면 부록 개념으로 정리하기로 하고, 궁금하신 분들은 검색을 해보시라! 간단히만 적어 두자면, 카르텔에서 죄수의 딜레마 게임이 발생했을 때 카르텔협정 위반이 우월전략이 되면 카르텔이 쉽게 와해된다, 뭐 그런 내용이다. 공공재 역시 공공재 생산 비용을 부담하지 않는 편이 우월전략이 되면 공공재가 아예 만들어지지 않게 되고, 따라서 정부가 공공재 생산과 공급을 떠맡게 된다는 얘기다.

 

[경제학원론] 게임이론·죄수의 딜레마·내쉬균형

 

마지막 내쉬균형! 이 친구도 우월전략균형에서와 마찬가지로 서로의 선택지를 가정하고 균형을 찾아야 하는데, 조금 까다로운 면이 있다. 현실적으로 상대가 어떤 짓을 하든 내가 항상 유리한 게임은 존재하기 힘들고, 보통은 상대가 뭘 하느냐에 따라 내 선택도 바뀌기 마련이다. 이렇게 상대방의 전략이 주어질 때 자신의 입장에서 최적인 전략을 내쉬균형전략이라고 하며, 각 경기자가 이 전략을 채택할 때 내쉬균형이 이루어진다.

 

위 표를 보자. 스투데오와 찬디르가 과일 가게를 연다. 스투데오는 자몽과 포도 중 하나를, 찬디르는 키위와 멜론 중 하나를 팔 생각이다. 각각의 과일을 팔았을 때 보수행렬이 표와 같이 나온다고 하자. 앞에서와 같이 하나하나 가정하면…….

 

-찬디르 입장에서

스투데오가 자몽을 선택하면: 키위 파는 게 이득

스투데오가 포도를 선택하면: 멜론 파는 게 이득

 

 

-스투데오 입장에서

찬디르가 키위를 선택하면: 포도 파는 게 이득

 

찬디르가 멜론을 선택하면: 포도 파는 게 이득

 

멜론-포도에서 각자의 내쉬균형전략이 만났다. 찬디르와 스투데오는 여기에 균형이 만들어지면 상품을 굳이 바꾸려 하지 않을 것이다. 만약 이 상태에서 찬디르가 멜론을 키위로 바꾼다면 이윤이 1 떨어질 거고, 스투데오도 포도를 자몽으로 바꾸면 이윤이 2 떨어지고 만다.

반응형