거듭제곱 확률 분포(를 보이는 것으로 추측/가정되는 데이터)로부터 거듭제곱 지수를 얻는 방법에는 여러 가지가 있다. 클로짓, 살리지, 뉴만은 작년에 낸 논문에서 어떤 데이터가 거듭제곱 꼴인지 아닌지를 판별하는 체계적인 방법을 제시하고 이를 실제 다양한 데이터에 적용하고 있다.

이외에도 주로 모형연구에서 쓰이는 방법 중의 하나로 모멘트 분석(moment analysis) 방법이 있다. 시스템 크기에 따라 시늉내기로부터 얻은 확률 분포의 모양이 달라지는데 이러한 시스템 크기 의존성을 밝혀내는데 많이 쓰인다. 우선 어떤 변수 x의 확률분포가 다음과 같은 모양이라고 하자.

P(x,L) = x^(-τ) f(x/L^D)

L은 시스템의 크기이고 τ, D는 관련된 거듭제곱 지수(power-law exponent)다. 여러 L에 대해 시늉내기를 하면서 x의 분포를 얻을 수 있는데, 이로부터 P(x,L)이 주어지고 이 분포가 위의 식을 따른다고 가정한 후 τ와 D를 동시에 구해낼 수 있는 방법이다. 어떤 변수 x의 q-모멘트는 x^q의 기대값이며 다음처럼 정의된다.

<x^q> = ∫dx x^q P(x,L)

이 식은 x에 대한 적분이므로 그 결과는 q, L, τ, D에만 의존한다. (물론 함수 f의 모양에 따라 달라지지만 그 값 자체가 중요한 건 아니다.) 특히 이 값은 L의 거듭제곱 꼴로 나타나며 그 지수가 τ, D의 함수가 된다. 다시 말해서 다음 식을 만족시킨다고 하자.

<x^q> ~ L^σ(q)

위의 적분식에 P(x,L)를 넣고 적분한 후 L에 관한 의존성만 뽑아내면 다음을 얻는다.

<x^q> = const. L^(D(q + 1 - τ))

즉 σ(q) = D(q + 1 - τ)이다. q=0이면 P(x,L)은 L에 무관하게 규격화되어 있으므로 <x^0> = 1이고 σ(q=0) = 0이 된다. 하지만 q가 커지면서 σ(q)는 q에 관한 일차함수 꼴로 나타난다. 그래서 P(x,L)로부터 σ(q)를 얻으면, σ(q)의 기울기 D와 y 절편 D(1 - τ)를 얻을 수 있고 이로부터 τ도 얻어낼 수 있다.

하지만 문제가 있다. 말했듯이 σ(q)는 q가 어느 정도 커야만 q에 대한 선형이 된다. q가 커지면 x의 q-모멘트를 구할 때 큰 x에 의한 비중이 높아지며 P(x,L)에서 x^(-τ) 부분보다 f(x/L^D) 부분이 더 크게 작용하게 된다. 그래서 큰 q에서 지수들을 구하면 D는 더 정확해지는 대신 τ의 불확실성은 커진다. 대개 x^(-τ)가 깨끗하게 나타나는 영역은 x가 너무 작을 때도 아니고 너무 클 때도 아닌 중간 영역이기 때문이다.

그렇다고 해서 q가 너무 크지 않은 영역에서 σ(q) = D(q + 1 - τ)로 D, τ를 구한다고 해서 x의 중간 영역이 잘 반영된다고 보기는 힘들 것 같다. 일단 q가 1보다 크기만 하면 큰 x의 비중이 q에 따라 커지는 것일 뿐 적당한 영역의 x에 더 많은 비중을 둔다거나 하는 건 아니기 때문이다.

x의 확률분포가 깔끔하게 그려지면 이런 고민까지 필요 없지만 P(x,L) 자체가 조금 지저분한 모양이라 어떤 영역의 x 또는 어떤 영역의 q를 이용해야 하는지에 관한 불확실성이 생겨서 요즘 고민중이다. 그래서 이런저런 대안을 생각해보고 있는데 딱히 이거다 싶은 방법이 없다. 그래서 또 다른 논문들을 찾아 읽다가 모멘트 분석 결과의 해석에 관한 아이디어들을 발견하는 수확도 있었다.