앞 글에 이어, "비에르고딕 경제학, 기대효용, 켈리 조건"이라는 블로그 글에 관한 내 생각을 정리해보겠다. 이 글은 앙상블평균 또는 "평행우주"에 의한 기대효용은 개인에게 적용되지 않으며, 시간평균이 우리가 사는 "비평행우주"에서 경험한 것을 더 잘 반영한다고 주장한다. 이 주장은 그 자체로 재미도 있어보이고 중요한 얘기인 것 같은데 이 주장을 뒷받침하기 위해 제시한 예는 주장과 맞지 않는 것으로 보인다. 예시를 따라가보자.


내 재산 중 x만큼 비율을 판돈으로 걸고 앞면이 나올 확률(p)이 60%인 동전던지기를 한다고 하자. x는 0 이상 1 이하라고 하자. 이를테면, x=1은 전재산을 판돈으로 건다는 말이다. 앞면이 나오면 내기한 만큼 돈을 받아서 내 재산은 1+x배가 되고, 뒷면이 나오면 내기한 돈을 모두 잃어서 내 재산은 1-x배가 된다. x의 최적값은 얼마일까?


1. 기대효용: 동전던지기를 1회만 하는 경우, 기대수익률은 다음처럼 얻어진다.


$$p(1+x)+(1-p)(1-x)=1+(2p-1)x$$


p가 1/2보다 크므로 이 수익률을 최대화하는 x는 1이다. 즉 전재산을 거는 게 최적이다. 문제는 한 번만 뒷면이 나와도 전재산을 잃는다는 거고, 평균적으로 1/(1-p), 즉 2.5번에 한번꼴로 뒷면이 나오게 된다.


2. 켈리 조건: 이런 접근에 대한 대안으로 켈리 조건을 소개한다. n번 동전던지기를 하는데 매번 그 이전까지의 결과(재산)를 이용해서 판돈을 건다(즉 곱하기 과정이다). n번 중 v번 앞면이 나온 경우를 생각한다. 기대수익률은 다음처럼 쓸 수 있다.


$$(1+x)^v(1-x)^{n-v}$$


n이 매우 큰 상수라고 가정하면 v/n을 p로 어림할 수 있고, 이때 이 수익률을 최대로 만드는 x는 2p-1이다. p=0.6일 때 x의 최적값은 0.2, 즉 재산의 20%만 판돈으로 내면 좋다는 결과가 얻어진다.


첫번째 접근보다 더 그럴 듯해 보이는 건 맞는데... 내 해석은, 둘은 게임의 세팅 자체가 다르다는 것이다. 1회 게임 대 n회 게임. 켈리 조건은 기대효용과 다른 접근으로 보이지만 여전히 기대효용의 틀 안에서 생각할 수 있다. 다음 식을 보자.


$$\sum_{v=0}^n {n\choose v}p^v(1-p)^{n-v}\cdot (1+x)^v(1-x)^{n-v}$$


즉 n번 동전던지기를 해서 v번 앞면이 나올 확률을 고려하여 켈리 조건을 위한 기대수익률을 '제대로' 썼다. 켈리 조건은 이 기대수익률을 n이 매우 크다는 가정 하에 '근사'한 것에 불과하다. n이 매우 크다면 v=p*n인 항이 다른 모든 항들을 압도하기 때문이다. 그리고 위 식에 n=1을 대입하면 첫번째 접근에 의한 결과와 같은 결과를 얻는다.


첫번째 '기대효용' 접근이 틀린 게 아니라 문제 세팅이 달라짐으로써 다른 결과가 얻어졌다고 보는 게 맞다. 그리고 첫번째 접근에 의한 답이 부적절해보이는 것은 위험회피로 인한 성향일 뿐 기대효용 접근 자체의 문제는 아니라는 생각이 든다. 또한 위 블로그 글의 저자는 "곱하기 과정(multiplicative process)"이 기본적으로 비에르고딕이라고 했는데, p값이 게임 실행과 무관하게 일정하다는 면에서 비에르고딕이라고 할 수 없다.


아직 정리되지 않은 사항들이 있는데 오늘은 여기까지;;;;