지금까지는 행위자의 선택/행동이 곧 결과를 뜻했고 그 관계는 결정론적이었으므로 선택에 대해서만 얘기했다. 이번 장에서는 행동과 결과의 관계가 확률적인(stochastic) 상황을 생각할텐데, 복권(lottery)의 집합 위에서 선호와 선택을 다룬다. Z를 결과(상; prize)들의 집합이라고 하면, 복권은 Z에 대한 확률측도(probability measure)다. 즉 각 상 z에 음이 아닌 수 p(z)를 부여하는 함수인 p를 뜻한다. p(z)를 모든 z에 대해 더하면 1이 된다. 확률이 1인 복권은 [z]로 표시한다. 즉 [z](z)=1이다. 상 x가 α의 확률로 실현되고 상 y가 1-α의 확률로 실현되는 복권은 다음처럼 나타낸다.

$$\alpha x \oplus (1-\alpha)y$$

상들(결과들)의 집합 Z 위에서 정의되는 복권공간 L(Z)를 고려하겠다.

이제 공간 L(Z) 위의 몇가지 '안정된' 선호들을 생각해보자.

1. 균일함에 대한 선호: p의 분산이 적은 복권을 선호한다. 분산(dispersion)은 다음처럼 정의된다.

$$\sum_z (p(z)-1/|Z|)^2$$

2. 가장 비슷함에 대한 선호: p(z)의 최대값이 q(z)의 최대값보다 크다면 p를 q보다 선호한다.

3. 받침(support)의 크기: 0보다 큰 확률을 갖는 상의 개수가 많은 복권을 선호한다. 받침은 다음처럼 정의된다.

$$supp(p)=\{z|p(z)>0\}$$

위 예들에서는 결과를 무시하고 확률분포만 가지고 선호가 결정되었다. 결과까지 고려한 예를 들어보자.

1. "좋은" 결과의 확률을 키우기: 집합 Z는 G(good)와 B(bad)의 두 겹치지 않는 집합으로 나뉘며, 의사결정자는 좋은 상들을 더 높은 확률로 얻을 수 있는 복권을 선호한다.

2. 최악의 경우: 복권 p로 얻을 수 있는 최악의 상이 복권 q로 얻을 수 있는 최악의 상보다 선호된다면 p가 q보다 선호된다.

3. 가장 나올 법한 상을 비교하기: 의사결정자는 각 복권에서 가장 나올 법한 상을 비교하여 선호관계를 결정한다.

4. 사전식 선호: 각 복권의 상들에 순서가 매겨지며, 그 순서대로 비교하여 더 좋은 복권을 선호한다.

5. 기대효용: 각 상에 숫자가 부여되는데 이를 v(z)로 쓴다. v의 기대값을 비교하여 선호를 결정한다. 즉, 다음과 같다.

$$p\succsim q \textrm{ if } U(p)=\sum_z p(z)v(z)\geq U(q)=\sum_z q(z)v(z)$$

폰노이만-모르겐슈테른 공리화(von Neumann and Morgenstern Axiomatization)를 위해 두 공리를 소개한다. 하나는 독립 공리, 다른 하나는 연속 공리다. 합성복권(compound lottery) 개념을 먼저 도입한다. K개의 복권을 각 복권이 실현될 확률 α를 이용해 합성하여 다음처럼 쓴다.

$$\oplus_{k=1}^K \alpha_kp^k,\ (\oplus_{k=1}^K \alpha_kp^k)(z)=\sum_{k=1}^K \alpha_k p^k(z)$$

이 합성복권은 다음 두 단계로 이루어진다.

단계 1: K개 중 하나의 복권을 αk의 확률로 선택한다.

단계 2: 선택된 복권으로부터 상이 랜덤하게 결정된다.

이 두 단계는 독립이며 이게 독립 공리(The Independence Axiom)다.

독립(Independence, I):

L(Z)에 속한 어떤 p, q, r에 대해서도, 0보다 크고 1보다 작은 어떤 α에 대해서도,

$$p\succsim q \textrm{ iff } \alpha p\oplus (1-\alpha)r\succsim \alpha q\oplus (1-\alpha)r$$

를 만족한다. 이로부터 성질 I*가 딸려나온다.

K개의 복권으로 이루어진 합성복권 2개가 있는데 각각 {p}와 {q}라고 하자. 두 합성복권이 단 하나의 k*에 대해서만 다르고 나머지는 모두 똑같다면, 다음과 같다.

$$\oplus_{k=1}^K \alpha_k p^k \succsim \oplus_{k=1}^K \alpha_k q^k \textrm{ iff } p^{k^*}\succsim q^{k^*}$$

다음으로 연속 공리를 소개하는데, 연속성이란 다름 아니라 선호가 확률의 작은 변화에 별로 민감하지 않은 상황을 가리킨다.

연속(Continuity, C):

p가 q보다 선호된다면 p의 이웃 B(p)와 q의 이웃 B(q)가 있어서 B(p)에 속한 모든 p'과 B(q)에 속한 모든 q'에 대해 p'이 q'보다 선호된다.

연속의 또다른 정의는 다음과 같다.

C*:

p가 q보다 선호되고 q는 r보다 선호된다면, 다음을 만족시키는 0과 1 사이의 α가 있다.

$$q\sim [\alpha p\oplus (1-\alpha)r]$$

앞서 들었던 예들이 이 두 공리를 만족하는지 살펴보자.

1. 기대효용: U(p)는 p에 대해 선형이므로 I를 만족한다. U(p)는 확률벡터에 연속이므로 C도 만족한다.

2. "좋은" 결과의 확률을 키우기: 두 공리를 모두 만족하는데, G에 속한 상에 대해 v(z)=1이고 B에 속한 상에 대해 v(z)=0인 v로 생각할 수 있기 때문이다.

나머지 예들은 생략한다.

드브뢰의 정리에 따라 C를 만족하는 복권공간 위에서 정의된 어떤 선호관계도 효용표현 U를 갖는다. 즉 U(p)가 U(q)보다 크거나 같다면 p는 q보다 선호되거나 동등하며 역도 성립한다.

정리(vNM):

\(\succsim\)를 I와 C를 만족하는 L(Z) 위의 선호관계라고 하자. 다음을 만족하는 v(z)들이 있다:

$$p\succsim q \textrm{ iff } U(p)=\sum_{z\in Z}p(z)v(z)\geq U(q)=\sum_{z\in Z}q(z)v(z)$$

여기서 U는 복권 p의 효용수(number)이며 v는 베르누이수 또는 vNM 효용이라 부른다. 이를 증명하기 위해 다음 도움정리가 필요하다.

도움정리:

\(\succsim\)를 공리 I를 만족하는 L(Z) 위의 선호라고 하자. Z에 속한 x,y가 다음 조건을 만족한다고 하자.

$$[x]\succ [y],\ 1\geq\alpha >\beta\geq 0$$

그러면 다음이 성립한다.

$$\alpha x\oplus (1-\alpha)y\succ \beta x\oplus (1-\beta)y$$

vNM 효용은 유일한데, 양수를 곱하거나 어떤 상수를 더하는 것을 포함하여 유일하다. 즉

$$w(z)=\alpha v(z)+\beta\ (\alpha>0)$$

도 v(z)와 같은 선호관계를 표현한다.

이 다음에는 카네만과 트버스키의 실험을 소개하는데 잘 알려진 거라서 굳이 정리하지 않겠다. 끝.