SBS 스페셜 세상은 생각보다 단순하다 편을 앞부분만 다시 보았다. 지난 글에서 다 쓰지 못한 내용의 일부를 오늘 정리해보려고 한다. 방송에 대한 비판보다는 방송 내용에 대한 보충설명 정도로 봐주면 좋겠다.


마크 뷰캐넌이 거듭제곱 분포(멱함수 분포)를 난해해 보이는 수식 없이 편하게 설명하기 위해 도입한 개념이 '임계숫자'다. 여기에 이어서 김용학 교수께서 그 숫자의 의미를 얘기하시는데 수학적으로는 정확히 맞는 얘기가 아니다. 전쟁이 일어났을 때 그 사망자수를 x라고 해보자. 뷰캐넌은 x의 분포(또는 히스토그램)에 대한 얘기를 한다. 즉 x=1인 전쟁이 몇 번이고, x=10인 전쟁이 몇 번이고, x=100인 전쟁이 몇 번이고... 이런 말이다.


하지만 김용학 교수는 순위곡선(rank curve)에 관해 얘기한다. 역사상 가장 많은 사망자를 낸 전쟁과 그 다음 많은 사망자를 낸 전쟁, 그 다음, 그 다음... 이런 식이다. 가장 많은 사망자수를 x1이라고 하고 그 다음 많은 사망자수를 x2라고 해보자. 순위가 낮아질 때마다 이런 x값들이 어떻게 줄어드느냐를 보려면 x2 나누기 x1의 값을 봐야 한다. 그 다음엔 x3 나누기 x2를 봐야 한다.


x의 분포(뷰캐넌이 주로 설명한 내용)와 x의 순위곡선(김용학 교수의 설명)은 물론 밀접하게 연결되어 있다. 이 방송의 주요한 주제였던 거듭제곱 분포의 경우, 매우 큰 x를 갖는 사건들이 비교적 자주 나타난다고 거칠게 말할 수 있다. 이런 큰 사건들이 자연스럽게 순위곡선의 앞부분(상위 사건들)을 형성한다. 그 다음으로 큰 x들은 분포에서는 중간 영역에 해당하고 순위곡선에서도 중간 영역에 해당한다. 결과적으로 거듭제곱 분포를 보이는 x의 순위곡선은 순위에 따라 급격하게 줄어든다.


이제 분포에서 정의된 임계숫자와 순위곡선에서 순위에 따른 x의 비율(x2/x1 등)을 제대로 구해서 비교해보자. 산수를 좀 해보겠다는 말이다. x의 분포를 n(x)라고 하자. 즉 x라는 사망자수를 내는 전쟁의 수가 n(x)다. n(x)가 거듭제곱 분포라는 말은 다음 식을 따른다는 말이다.


$$n(x)=Ax^{-\alpha}$$


여기서 x 위에 올라가 있는 알파가 '거듭제곱 지수'다. 임계숫자를 C라고 하면 다음과 같다.


$$C=\frac{n(x/2)}{n(x)}=2^{\alpha}$$


즉 어떤 현상에서 관찰된 거듭제곱 지수를 알면 임계숫자를 바로 구할 수 있다. 이걸 순위곡선과 연결시켜 보자. 순위곡선은 x를 큰 순서대로 나열한 후 순위의 함수로 x를 표현한 건데, 그 순위를 r로 쓰겠다. r순위의 x값을 x_r로 쓰자. 1순위 사건은 1개 밖에 없다고 하자.


$$n(x_1)=1$$


이다. 그 다음으로 큰 x를 갖는 사건이 3개라고 하면, 편의상 이들을 2위, 3위, 4위라고 하고 이때의 x를 x_4로 부르겠다.


$$n(x_1)+n(x_4)=4$$


이걸 일반적으로 쓰면 다음과 같다.


$$\sum_{x=x_r}^{x_1}n(x)=r$$


이렇게 x의 분포 n(x)와 x의 순위곡선 x_r이 연결된다. 이제 자세한 설명은 생략하고;;; x가 연속적인 양이고 N이 엄청나게 크다고 가정한 후 n(x)가 거듭제곱 형태일 때 위 식을 풀면 다음 결과를 얻는다.


$$x_r=a\left(\frac{r}{N}\right)^{-\beta},\ \beta=\frac{1}{\alpha-1}$$


a는 x 중 최소값이다. 순위와 그 순위의 x값 사이에 거듭제곱 꼴이 있음을 알 수 있고, 이게 김용학 교수가 설명하신대로 급격히 줄어드는 순위곡선에 해당한다. 이 결과를 이용해서 순위가 낮아질수록 x 사이의 비율이 어떻게 바뀌는지를 바로 구할 수 있다.


$$\frac{x_{r+1}}{x_r}=\left(\frac{r}{r+1}\right)^\beta$$


1순위 x와 2순위 x의 비율은 위 r에 1을 넣으면 얻어진다. 이 비율은 뷰캐넌의 임계숫자 C와 다르다. C는 거듭제곱 지수만으로 표현되지만, 이 비율은 어떤 순위의 x들을 비교할지, 즉 r의 함수로 나온다. 또한 거듭제곱 지수(알파)가 직접 쓰이지 않고 그것의 변형된 베타가 비율을 결정한다. 이 글은 여기까지 하자.