거듭제곱 분포를 만들어내는 메커니즘을 더 얘기해보겠습니다. 역시 뉴만의 2005년 논문에 나온 내용들입니다. 율 과정과 상전이/임계현상이라는 두 가지 가장 중요한 건 이미 얘기했고요, 나머지 세 가지 중 하나는 마구잡이 걷기(random walk)입니다. 근데 이것도 제 블로그에서 이러저러하게 얘기를 많이 한 것이므로 빼고, 남은 두 가지는 '지수함수의 조합'과 '거듭제곱 관계에 있는 양들'입니다.

1. 지수함수의 조합

어떤 양 y의 분포가 지수함수 꼴이라고 합시다. P(y) ~ exp(ay). 그런데 다른 양 x가 y와 지수함수 관계에 있다고 합시다. x ~ exp(by). 이 두 식에서 y를 소거해주면, x의 분포는 거듭제곱 분포가 됩니다.


지수함수 분포나 지수함수 관계는 사실 매우 자연스럽죠. 지수함수가 자연스럽다면 이로부터 바로 유도되는 거듭제곱 분포도 사실은 매우 자연스러운 겁니다. 그러니까 거듭제곱 분포가 뭐 대단히 신기한 게 아니라는 말씀.

2. 거듭제곱 관계에 있는 양들

두 양 x와 y가 지수가 a인 거듭제곱 관계에 있다고 합시다. 그럼 아래 두번째 식(항등식)을 이용하여 변환해주면 세번째 식이 나옵니다.


만일 P(y)가 대충 상수로 어림할 수 있는 모양의 분포거나, 좀더 일반적으로, 분산이 발산하지 않는 착한(;;;) 모양이라면 P(x)는 x의 거듭제곱 꼴로만 쓸 수 있습니다. 그러면 그 지수 α는 위의 마지막 식처럼 a의 함수가 되는거죠.

뉴만의 논문에 따르면, 위의 결과에서 처음부터 거듭제곱 관계(x와 y의 관계)를 가정하고 그 결과로 거듭제곱 분포가 나왔으니 당연한 거 아니냐는 반론이 있을 수 있다고 합니다. 이에 대한 뉴만의 대답은 다음과 같습니다. x와 y의 거듭제곱 관계는 물리량 사이의 관계이지 이 양들의 확률분포에 대한 가정이 아니다, 그럼에도 x라는 양의 확률분포가 거듭제곱 분포인 것은 당연한 결과가 아니다(non-trivial)라고 합니다.

그렇습니다. 하여간 알아둘 점은 거듭제곱 분포가 어떤 과정을 통해 나왔는지, 그 밑에 깔려 있는 기본 메커니즘이 무엇인지를 생각할 때 다양한 가능성을 생각해봐야 한다는 겁니다.