Togloomiin onol


게임이론

책 소개

고객과의 세일즈 협상, 경쟁사와의 신제품 개발이나 시장점유율 경쟁, 조직 내 평가와 승진에 이르기까지 모든 비즈니스는 게임이다. 비즈니스맨들이 비즈니스라는 게임의 규칙을 배우고 그 게임에서 승리하기 위해 끊임없이 전략을 짜낼 때 유용하게 사용되는 것이 바로 ‘게임이론’이다.

‘미래의 CEO를 위한 MBA 시리즈’로 기획된 이 책은 게임이론의 주요 개념을 쉽게 전달하고, 이를 통해 직감이나 경험으로 수행하던 비즈니스에 체계적이고 전략적으로 접근한다. 그리하여 상대방의 불확실한 의사결정이나 행동을 분석틀을 이용하여 파악하고 해석하여 효과적인 의사결정을 할 수 있도록 돕는다.

저자 그로비스 매니지먼트 인스티튜트

그로비스 그룹의 각 사업을 통해 축적된 노하우를 바탕으로 서적 출판, 디지털 콘텐츠 작성, 경영 능력 진단 테스트 등을 통해 실천적인 경영 연구개발을 진행 중이다.

역자 박철주

삼육대학교 경영학과를 졸업하고, 일본 게이오대학 상학연구과에서 석사·박사 학위를 받았다. 지은 책으로 『유통기업의 경영분석』『나도 23살에 가게 하나 차렸으면 좋겠다!』『미국에서의 소매업태의 발달사』 등이 있다.

 

차례

감수자의 글/저자서문

제1부 기초편

제1장 1단계 게임으로 기본적인 개념을 이해한다

1. 죄수의 딜레마

2. 내쉬균형과 남녀의 논쟁

3. 동전 던지기 게임과 혼합전략

4. 연속적 전략. 연속적 이익과 과점 (寡占)에서의 경쟁이론

제2장 다단계게임으로 응용력을 연마한다

1. 순차게임과 부분게임 완전균형

2. 유한반복게임

3. 무한반복게임

제2부 응용편

제3장 정보의 불확실성을 고려한다

1. 비대칭정보게임

2. 비대칭정보게임의 연속과 정보조작

3. 의뢰인과 대리인 게임

4. 옥션 이론

5. 교섭이론과 협력게임

제4장 미래의 게임이론

1. 게임이론의 과제와 미래

게임이론의 역사

저자후기

참고문헌

미주

게임이론

제1장 1단계 게임으로 기본적인 개념을 이해한다

죄수의 딜레마

‘죄수의 딜레마’의 원 모델은 공범인 강도 2명이 플레이어로 설정되어 있다. 두 사람은 각각 다른 사건으로 체포되어 독방에서 취조를 받는다. 검찰은 강도죄를 뒷받침하는 증거가 불충분하기 때문에 범인들이 묵비권을 행사한다면 1년 정도의 징역형만을 선고받을 것이라고 예상했다. 그러나 둘 중 한 명이 자백하고 다른 한 사람이 묵비권을 행사한다면 자백한 사람은 불기소로 방면되고, 묵비권을 행사한 사람은 20년 징역형을 선고받을 것이다. 그리고 두 사람 다 자백한다면 공범이 되어 각각 10년형을 선고받을 것이다. 그것을 이익행렬로 만든 것이 <표1>이다. 괄호 한의 연수가 마이너스(-)인 것은 공범자들의 징역 연수가 적은 쪽이 이익(연수가 늘어날수록 이익은 마이너스가 된다)이라는 것을 나타낸다. ‘죄수의 딜레마’ 원 모델의 해법은 공범자 두 명이 모두 ‘자백’이라는 절대우위전략을 선택하고, 두 사람이 각각 10년간 복역하는 것이다.

<표1> 공범자 2
 공범자 1   묵비권 자백
묵비권 (-1,-1) (-20, 0)
자백 (0, -20) (-10, -10)

 

죄수의 딜레마는 실제 비즈니스 세계에서 자주 발생하는 상황이다. 특히 서로가 1회 한정거래(게임)라는 것을 알고 있는 상태에서는 상대를 제치고 자신만 이기려는 유혹에 빠지기 쉽다. 이러한 상황에서는 상대가 배신할지도 모른다는 의심 때문에 서로가 적은 이익을 얻는 데 그친다는 것을 알면서도 절대우위전략을 선택하게 된다. ‘죄수의 딜레마’ 상황에서 더 높은 이익을 얻기 위한 몇 가지 해결 방법을 생각해 보자.

① 상대가 배신할 경우 벌칙을 부과한다 : 배신한 상대에게 벌칙을 부과하여 자신만 이익을 얻고자 하는 유혹을 억제하는 방법이다. 이 계약이 법적 효력이 있는지 없는지는 별개의 문제이다. 다만 이렇게 함으로써 이 게임의 이익을 변경하여 절대우위전략을 없앨 수 있다.

② 게임을 1회 이상 계속한다 : 두 회사가 앞으로 어떤 형태로든 거래를 계속할 가능성이 있다면 이번 건에서 상대를 배신하여 눈앞의 이익을 추구하는 것이 앞으로의 관계를 고려했을 때 반드시 이익이라고 할 수는 없다. 미래에 배신당한 쪽이 배신한 쪽에게 이익이 되지 않는 행동을 취할지도 모른다고 예상한다면 그것만으로 ‘눈앞의 이익을 위해 상대를 배신하는 행위’를 억제하는 효과가 있다. 즉, 게임을 ‘1회’가 아니라 ‘반복’했을 때 서로 다른 해답이 도출될 수 있다.

내쉬균형과 남녀의 논쟁

(사례1) A은행과 B은행이 합병되어 정보시스템을 통합할 경우 현재 A은행이 사용하고 있는 외국계 D사의 시스템을 채용하는 방법과 현재 B은행이 사용하고 있는 국내 정보처리회사인 E사의 시스템을 채용하는 두 가지 방법이 가장 현실적이다. A은행이 사용하고 있는 D사의 시스템으로 통합된다면 A은행은 2억 엔의 수익을 기대할 수 있다. 그러나 B은행은 합병 상대의 시스템으로 통합되기 때문에 1억 엔의 수익을 얻는 데 그칠 것이다. 반대로 B은행이 사용하고 있는 E사의 시스템으로 통합된다면 A은행의 수익은 1억 엔, B은행은 2억 엔이 될 것이다. 최악의 시나리오는 두 은행이 전혀 다른 시스템을 도입할 때이다. 이렇게 되면 합병한다 하더라도 일정 시간 시스템 통합이 지연될 것이며, 두 은행의 합병에 따른 수익 개선 효과는 기대할 수 없다. 오히려 두 회사 모두 1억 엔의 손실을 각오해야만 한다.

먼저 사례 1에서 게임의 플레이어, 전략, 이익을 간단하게 이익행렬로 정리하면 <표2>와 같다.

<표2> B은행
 A은행   D사 E사
D사 (+2, +1) (-1, -1)
E사 (-1, -1) (+1, +2)

 

A은행과 B은행 모두 상대가 어떤 선택을 하느냐에 따라 영향을 받게 된다. 상대 은행의 선택과는 상관없이 유리하게 선택할 수 있는 절대우위전략이 존재하지 않기 때문이다. 그렇다면 두 플레이어는 상대가 어떤 전략을 선택할지 예측할 수 있을까?

이때 유용한 개념이 바로 ‘내쉬균형(Nash equilibrium)’이다. 내쉬균형은 ‘모든 플레이어가 다른 플레이어의 전략을 전제로 최적의 전략을 선택하는 상태’를 말한다. 즉 플레이어들이 내쉬균형에 만족하는 전략을 선택할 경우 어떤 플레이어든 간에 다른 전략을 선택하면 더 낮은 이익을 얻게 된다. 내쉬균형전략은 다른 전략조합에 비해 실제로 선택될 가능성이 높을 뿐만 아니라 절대우위전략보다 빈번하기 때문에 게임에서 각 플레이어가 선택할 수 있는 전략을 도출하는 데 유용한 개념이다. 그러나 보통 게임에서 내쉬균형전략은 여러 개 존재한다.

‘남녀의 논쟁(battle of the sexes)’ 게임에서는 원래 남녀가 데이트를 하기 위해 오페라와 복싱 중 어느 것을 보러 갈 것인지를 결정하는 것이다. 남자는 복싱을 보는 것(+2)이 오페라를 보는 것(+1)보다 바람직하다고 생각하고, 여자는 오페라를 보는 것(+2)이 복싱을 보는 것(+1)보다 바람직하다고 생각하고 있다. 그러나 서로 따로따로 보러 가는 것만은 피하고 싶다(-1). 여기에서는 [복싱, 복싱]과 [오페라, 오페라] 두 개의 전략 조합이 내쉬균형의 조건을 만족하고 있다.

게임이론에서 내쉬균형은 중요하고도 유용한 개념이긴 하지만 여기에도 해결되지 않은 문제가 있다. 그 중 하나는 내쉬균형에 도달하는 방법이 명확하게 규명되지 않았다는 것이다. 예를 들어 사례 1과 같이 A은행과 B은행이 사전에 협의할 수도 없고 상대가 어떤 전략을 선택할지도 알 수도 없는 상태에서 의사결정(동시게임)을 할 경우 어떤 조건이 내쉬균형전략으로 귀결되는가 하는 점이다. 내쉬균형은 일단 그것에 만족하는 전략으로 귀결된 이상 모든 플레이어가 어떤 다른 전략도 선택할 수 없지만 그 전략에 도달하는 방법은 결코 명확하지 않다. 별도의 정보가 없이는 내쉬균형전략 이외의 전략, 즉 두 은행이 서로 다른 시스템을 선택할지도 모른다는 두려움이 생기게 된다. 또한 여러 명의 플레이어가 참가할 경우 각 플레이어들이 어떤 전략을 선택할지 예상하기가 더욱 어려워진다.

제2장 다단계게임으로 응용력을 연마한다

순차게임과 부분게임 완전균형

순차게임의 특징은 먼저 행동을 취하는 플레이어의 전략을 확인한 후에 다음에 행동할 플레이어가 자신의 전략을 선택하는 것이다. 따라서 상대의 행동이 ‘새로운 정보’가 되어 자신의 행동에 영향을 미친다. 순차게임 중에는 부분게임이 존재하는 것도 있으므로 여기에서는 ‘부분게임 완전균형’에 대해 알아보고, 그것을 발견하기 위해서 마지막에 얻는 이익에서 거슬러 올라가는 ‘후방귀납법’에 대해서도 알아보자.

(사례2) 중견 부품 생산업체인 K제작소는 중견 운송회사인 I사에게 J운수보다 저렴한 요금으로 배송해 준다면 J운수에 맡기고 있는 물량의 일부를 I사로 넘길 생각이라고 알려왔다. 원래 K제작소에서는 I사와 J운수 두 곳에 화물 배송을 맡겨왔다. 현재 K제작소와의 거래상황을 알아보니 I사는 1개월에 100만 엔, J운수는 500만 엔의 이익을 올리고 있었다. K제작소의 조건대로 J운수 거래물량의 일부를 I사로 가지고 올 경우 I사의 이익은 매달 200만 엔이 늘어나고, J운수의 이익은 그만큼 줄어든다. I사의 이익증가폭에 비해 J운수의 이익 감소폭이 더 큰 것은 그동안 J운수 측에 유리한 조건으로 거래가 이루어졌기 때문이다. 결국 I사는 자사의 상황과 K제작소의 제안을 받아들였을 때의 J운수의 행동을 신중히 분석해서 결정하기로 했다.

이 게임의 전략은 I사에게는 새로운 거래 제안을 ‘수락한다‘와 ’거절한다‘, J운수에게는 ’반격한다‘와 ’반격하지 않는다‘ 각각 두 가지 선택안이 있다. 사례 2의 상황을 게임트리(순차게임에서 순서를 포함하여 게임방법을 설명할 때 이용되는 것)를 이용하여 정리하면 <도표2-2>와 같다. 참고로 이익행렬을 이용하여 각 플레이어의 전략과 이익을 한눈에 알아볼수록 표로 나타낼 수는 있어도 게임의 순서를 나타낼 수는 없다. 실제로는 I사가 먼저 전략을 선택하고 그 다음에 J운수가 전략을 결정하지만, 이익행렬에서는 마치 양쪽이 동시에 전략을 선택하는 것처럼 분석되기 때문이다.

그 다음 ‘부분게임(subgame)’이라는 개념을 도입한다. 순차게임의 일부인 부분게임은 ’어떤 한 부분을 꺼내서 그것을 하나의 독립된 게임으로 분석하는 게임‘을 말한다. J운수가 ’반격한다‘ 또는 ’반격하지 않는다‘라는 분기점 이후부터는 그 자체를 하나의 게임으로 분석할 수 있다. 즉 J운수는 자사의 이익을 기준으로 ’반격한다‘와 ’반격하지 않는다‘ 둘 중 하나의 전략을 결정할 수 있다. 그렇다면 J운수는 ‘반격한다’와 ‘반격하지 않는다’ 중 어느 쪽을 선택하는 것이 좋을까? J운수가 반격하면 이익은 제로가 되고 반격하지 않으면 200만 엔의 이익을 얻게 되므로 이 부분게임에서만 생각한다면 망설임 없이 ‘반격하지 않는다’를 선택할 것이다.

J운수가 ‘반격하지 않는다’를 선택하는 것을 전제로 I사의 이익에 주목해 보자. ‘수락한다’를 선택하면 200만 엔의 이익을 얻고, ‘거절한다’를 선택하면 100만 엔의 이익을 얻는 형태다. 그렇다면 I사는 이익이 더 많이 발생하는 ‘수락한다’를 선택한다. 이처럼 결과에서부터 거슬러 올라가는 방법을 ‘후방귀납법(backward induction)’이라고 한다. 이것을 좀더 간단하게 설명하면 다음과 같다. 맨 마지막 분기점을 기준으로 하는 부분게임에서 플레이어가 어떤 전략을 선택할지를 분석하고, 선택했을 때 얻는 이익을 전제로, 그곳에서부터 앞의 분기점(부분게임)으로 거슬러 올라가 어떤 전략을 선택할지를 생각한다.

후방귀납법을 이용해서 각 플레이어가 선택하는 전략을 보면 모든 부분게임에서 각 플레이어가 내쉬균형전략을 선택하고 있음을 알 수 있다. 여기에서는 [I사 거절한다, J운수 반격한다]와 [I사 수락한다, J운수 반격하지 않는다]라는 두 가지 내쉬균형전략이 존재한다. 이 중 [I사 수락한다, J운수 반격하지 않는다]라는 전략조합을 ‘부분게임 완전균형(subgame perfect equilibrium)’이라고 한다. 이것은 순차게임에서의 단순한 내쉬균형보다 더 강력한 균형 개념이다. 그렇다면 부분게임 완전균형에 만족하는 전략이 내쉬균형전략과 다른 점은 무엇일까.

이익행렬에서 나타난 두 가지 내쉬균형전략 중에서 부분게임 완전균형의 조건에 맞지 않는 [I사 거절한다, J운수 반격한다]에 대해 살펴보자. 이것은  ‘I사가 수락한다면 J운수는 반격하겠다’는 식의 일종의 위협으로, I사가 수락하지 못하게끔 하는 J운수의 전략이다. 그러나 I사의 입장에서 보면 J운수가 아무리 ‘반격하겠다’고 위협하더라도 ‘어차피 우리(I사)가 수락해 버리면 J운수도 이익을 놓치는 행동(반격)을 할 리가 없다’는 예측이 나온다. 단 한 번 전략을 선택하는 게임에서는 J운수의 위협은 I사에게는 ‘신빙성 없는 위협’에 지나지 않는다. 이것이 바로 신빙성의 문제이다. 대조적으로 부분게임 완전균형의 조건을 충족하는 [I사 수락한다, J운수 반격하지 않는다]라는 전략조합은 신빙성의 문제가 없다. I사가 일단 ‘수락한다’를 선택할 경우, 이를 살펴본 J운수는 틀림없이 자사에 더 이익이 되는 ‘반격하지 않는다’를 선택한다. 즉 부분게임 완전균형의 조건에 만족하는 전략에는 ‘신빙성이 있다’고 할 수 있다.

제3장 정보의 불확실성을 고려한다

비대칭정보게임

각 플레이어가 다른 정보를 가지고 하는 게임을 비대칭정보게임이라고 한다. 그 중에서 응용 범위가 가장 넓은 것이 시그널링 게임(Signaling Game)이다. 이것은 정보를 가진 플레이어가 자신의 정보에 근거하여 먼저 어떠한 행동이나 신호(Signal)를 보내고, 정보를 갖지 못한 플레이어는 상대의 행동이나 신호를 가지고 그가 가진 정보를 추측하여 전략을 선택한다.                          

비대칭정보게임의 실제 사례로 가장 먼저 떠올릴 수 있는 것이 소비자(구매자)가 생산자나 소매업자(중고차 딜러)로부터 상품을 구입하는 경우다. 이 경우 전시장에 진열되어 있는 자동차의 가치(주행거리나 성능, 사고기록 등으로 평가된 중고차의 시장가치)에 대해 딜러가 훨씬 더 많이 알고 있다. 이와 같은 비대칭정보게임은 정보가 적을 수밖에 없는 플레이어(구매자, 은행, 구인 기업)가 더 많은 정보를 가진 플레이어(중고차 딜러, 기업, 구직자)의 행동이나 자격증 등의 시그널(신호)을 보고 상대방의 정체(우수한지 아닌지)를 추측하는 것이다. 정보를 가진 플레이어는 자신의 정보에 근거하여 먼저 어떤 행동이나 신호를 보낸다. 정보를 갖지 못한 플레이어는 상대의 행동이나 신호를 통해 그가 가진 정보가 무엇인지를 추측해 내어 자신의 전략을 선택하는 게임을 ‘시그널링 게임’이라고 한다.

(사례3) 나가세 씨는 교외의 간선도로 옆에서 작은 중고차 판매점을 운영하고 있는데 요즘 외제차 ‘V왜건‘의 판매에 대해 생각하고 있다. 중고 V왜건의 재고 중에는 신차와 같은 우량품이 전체 재고의 3분의 2를 점유하고 있고, 나머지 3분의 1은 성능에 문제가 많은 불량품이다. 나가세 씨는 그 중에서 한 대를 무작위로 골라 전시 판매할 생각이다. 우량품의 구입가는 150만 엔, 불량품의 구입가는 90만 엔이다. 나가세 씨는 무작위로 고른 차가 우량품인지 불량품인지 알 수 있지만 구매자가 언뜻 보기에 불량품도 우량품과 구별되지 않는다. 차를 구입하는 사람의 입장에서 이용 가치를 환산하면 우량품일 경우 160만 엔 상당의 이익을, 불량품일 경우 100만 엔 상당의 이익을 얻을 수 있다. 따라서 이 금액에서 구입가격(p)을 빼면 사는 사람이 얻게 되는 이익이 된다. 더욱이 사는 사람이 각각 160만 엔과 100만 엔 이상을 지불할 리는 없다. 나가세 씨는 고객이 불량품을 우량품이라고 착각하고 있는 듯하면 160만 엔을 부르고, 불량품인 것을 눈치 채고 있는 듯하면 100만 엔을 부를 생각을 하고 있다.

이 사례에서 각 플레이어가 취해야 할 행동을 분석해 보자. 먼저 게임트리를 사용하여 이 게임을 글로 표현해 보자. 이때 중요한 것은 ‘자연(nature)'(분기점에는 ’N’으로 나타낸다. ‘우연의 여신’과 같은 의미다)이라는 플레이어가 추가된다는 것이다.

‘우연의 여신’은 이 게임에서 최초로 취급되는 중고차가 우량품인지, 불량품인지를 결정한다. 정보를 가진 플레이어가 중고차 딜러, 정보를 갖지 못한 플레이어가 구매자이며, 딜러는 ‘여신’에게서 전달받은 차가 우량품이라면 그대로 전시장에 놓고 팔 수 있지만, 불량품일 경우에는 그대로 전시장에 내놓거나 시승 기간에만 우량품으로 보이게끔 정비를 해야 한다. 더욱이 정비를 할 경우에는 부품비(c)가 든다. 정비를 해도 차의 본래 성능은 달라지지 않으므로 구매자는 그것이 우량품인지 불량품인지를 차를 구입한 후에나 알 수 있다. 구입한 후에 불량품이라는 것을 알았다 해도 딜러는 보증에 대한 책임을 지지 않는다. 딜러는 이 차를 전시장에 내놓고 일정 가격(p)을 제시한다. 이 게임에서 구매자가 알 수 없는 것은 전시장에 진열되어 있는 차의 성능뿐이다. 위의 조건을 전제로 이 사례를 게임트리로 표현한 것이 <도표3-1>이다.

여기에서 주의해야 할 부분은 구매자(플레이어 2)의 분기점이다. 구매자는 차가 우량품인지 불량품인지 모른다는 사실을 점선으로 나타내고 있다.

 

Advertisements

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s