거듭제곱 분포(power-law distribution)의 원인과 메커니즘에 대해 잘 정리된 논문으로 뉴만의 2005년 논문을 들 수 있습니다. 그중에서도 율 과정은 1920년대에 생물종과 속의 분포에 대한 모형으로 율에 의해 제시되었습니다. 생물 종이라고 했지만, 그 대상은 도시, 연결망의 노드 등 어떤 것에도 적용할 수 있습니다.

꽃이 피는 식물에 대해 관찰한 결과, 각 속(genus)에 포함된 종(species)의 개수의 분포가 거듭제곱 지수가 약 2.5인 거듭제곱 분포를 따른다고 합니다. 이를 위해 모형을 제시하는데요, 우선 멸종은 고려하지 않는다고 하고요, 각 종들은 시간에 따라 일정한 비율로 종분화를 합니다. 종분화가 한 번 일어나면 하나의 종이 새로 생기는 거죠. 그렇게 해서 전체적으로 m개의 종이 새로 생길 때마다, 새로운 속을 1개 추가하고 거기에 새로운 종 1개를 만들어줍니다.

각 종의 입장에서 보면 각 종은 다른 종이 어떻든간에 그냥 일정한 비율로 종분화를 합니다. 각 종의 종분화는 서로에게 영향을 끼치지 않습니다. 하지만 그 종들의 집합인 속의 입장에서 보면 그 속에 포함된 종의 개수가 많을수록 종의 개수의 증가속도가 빨라집니다.

예를 들어, 1쌍의 부부가 1년 동안 1명의 아기를 낳는다고 합시다. 이들은 다른 부부의 출산과 무관하게 자신들의 아기를 낳습니다. 그러면 1000쌍의 부부가 사는 마을에서는 1년 동안 1000명의 아기가 새로 태어나지만, 100쌍의 부부가 사는 마을에서는 100명의 아기가 새로 태어납니다. 늘어나는 비율은 두 마을이 똑같지만 실제로 증가한 인구의 수는 10배 차이가 나는 거죠.

우리는 이런 현상을 '빈익빈 부익부'라고 표현할 수 있습니다. 그런데 '상호작용'의 관점에서는 어떨까요? 각 부부의 출산(한 종의 종분화)은 다른 부부의 출산(다른 종의 종분화)과 무관하므로 상호작용은 없습니다. 그럼에도 거듭제곱 분포가 나타날 수 있습니다. 수식을 통해 보겠습니다.

각 속에 번호를 붙이겠습니다. i번 속에 포함된 종의 개수를 k_i라고 하고요, 이 속에 포함된 종의 개수는 시간에 따라 k_i에 비례하여 늘어납니다. (빈익빈 부익부)


단위 시간마다 m개의 종이 기존 속들에서 발생하고, 그외 1개의 종이 새로운 속을 생성하면서 나타납니다. 즉 단위 시간마다 m+1개의 종이 새로 생깁니다. 그러므로 시각 t에 기존 속들의 총 종의 개수는 (m+1)t가 됩니다. 위 미분방정식은 바라바시-알버트 척도 없는 연결망의 이웃수 분포라는 글에서 나온 적이 있지요.

그 글에서 전개한 논리를 따라가면 k에 대한 거듭제곱 분포의 지수 γ를 a로 쓸 수 있고, 결과적으로 다음처럼 됩니다. 자세한 건 링크한 글을 참고하세요.


뉴만의 논문에 따르면 율의 연구에서 m은 약 2가 나왔고 이걸 위 결과에 넣으면 γ는 약 2.5가 나와서 관찰 결과를 잘 재현한다는 것을 알 수 있습니다.

하나만 더 얘기하면, m은 모형의 세부사항에 해당합니다. 그런데 이 세부사항이 거듭제곱 지수에 직접 영향을 미칩니다. 흔히 임계현상에서 얘기하는 세부사항이 거듭제곱 지수에 반영되지 않음으로써 '세부사항은 중요하지 않다'고 하는 논리가 여기서는 성립되지 않는 것으로 보입니다.

다음으로, 제가 위에서 '상호작용'에 대해 말했는데, 지금까지 거듭제곱 분포의 원인으로 '상호작용'을 강조해왔는데 그게 꼭 필요한 건 아닐 수도 있다는 얘기를 하려고 했습니다. 멸종을 고려하지 않고, 각 종은 다른 종과 무관하게 일정한 비율로 종분화를 한다는 것까지는 상호작용이라는 요소가 없어 보입니다. 그런데 m개의 종이 새로 생길 때마다 새로운 속이 1개 생긴다는 가정에 우리가 '상호작용'이라 부를 만한 요소가 있는지는 생각해봐야겠습니다.

율 과정 외에 상호작용이 명시적으로 포함되면서 거듭제곱 분포를 보여주는 모형으로 가지치기 과정(branching process)이 있습니다. 모래더미 모형의 평균장 결과에 이미 소개한 적이 있지요. 다시 위의 세부사항/보편성/상호작용 논의로 돌아가서 거칠게 얘기해보면, 율 과정은 상호작용이 없는 모형이며(이므로?) 세부사항이 중요해졌고 이로 인해 이러한 거듭제곱 분포에 대해 '보편성'을 논의하기 힘든 게 아닐까 하는 얘기를 해볼 수 있겠네요. 블라블라블라...