한 마디로 거듭제곱 분포(power-law distribution)는 '평균'이라는 관점을 대체한다는 말입니다. 이미 잘 알려진 사실이지만 제 블로그에 관련 내용이 없는 듯 하여 간단히 정리합니다. 거듭제곱 분포는 어떤 양(확률변수) x의 분포가 다음과 같은 거듭제곱 꼴이라는 걸 말합니다.


P(x)는 확률분포이며 모든 x에 대해 P(x)를 더하면/적분하면 1이 되어야 한다는 조건에 의해 위처럼 C가 붙습니다.

이제 확률변수 x의 n제곱의 기대값은 다음처럼 얻습니다.


맨 오른쪽을 보면, x에 무한대를 넣었을 때 이 값이 발산할 수도 있고 하지 않을 수도 있다는 게 보입니다. 그건 n과 γ의 값에 따라 결정되겠죠. n - γ + 1이 양수면 위 기대값은 발산하고, 음수면 발산하지 않습니다.

n=1인 경우 x의 평균(즉 <x>)은 γ가 2보다 작으면 발산하고, γ가 2보다 크면 발산하지 않습니다. n=2인 경우 <x^2>은 γ가 3보다 작으면 발산하고, γ가 3보다 크면 발산하지 않습니다.

만일 γ가 2와 3 사이라면, 평균은 발산하지 않는데 분산이 발산하는 상황이 됩니다. 일반적으로(?) 어떤 분포에 대해 '간단히' 말하고자 할 때 그 분포의 평균을 기준으로 분산이 얼마나 되는지를 말할 수 있는데, γ가 2와 3 사이인 거듭제곱 분포라면 평균을 말하는 게 의미가 없어집니다. 뭔가 명쾌하게 이해될 수 있는 예가 있을 것 같은데 떠오르지 않네요;;;

γ가 작을수록 커다란 x가 더 자주 나타날 수 있습니다. 이를테면 더 커다란 산사태라든지, 더 커다란 지진이라든지, 더 커다란 공황이라든지... 이렇게 커다란 사건들은 대개 '예외적'으로 받아들여지곤 하(했)는데, 거듭제곱 분포에 대한 이해가 늘어날수록 그런 커다란 사건은 더이상 예외적이지 않으며, 오히려 그런 사건들이 시스템 전체를 좌지우지할 수도 있는 가능성이 드러납니다. 어디선가 이걸 '개가 꼬리를 흔든다'가 아니라 '꼬리가 개를 흔든다'라고 말한 걸 봤는데 기억이 안나네요. 꼬리가 두꺼워서(fat tail) 가능한 일이겠죠.

---
* 2009년 3월 19일 저녁 8시 17분 덧붙임.
너구리님이 달아주신 덧글을 보고 내용을 덧붙입니다. Newman의 2005년 <Contemporary Physics> 논문을 참고했습니다.

우선 위에서 C는 바로 구할 수 있습니다.


그럼 P(x)는 위의 오른쪽 식처럼 쓸 수 있습니다. 여기서 C가 존재하려면 γ는 1보다 커야 한다는 조건이 필요합니다. 이제 이 거듭제곱 분포의 중간값(median; x_1/2로 나타냄)은 중간값의 정의에 따라 다음 식으로부터 구할 수 있고, 아래 식의 오른쪽이 그 결과입니다.


γ가 2와 3 사이라면 평균은 유한하지만 분산이 발산하므로 평균을 갖고 논의하는 것은 부적절해집니다. 위처럼 중간값은 γ가 1보다 크기만 하면 잘 정의되므로 평균보다는 대표값으로 쓰기에는 좀더 적절해보입니다. 하지만 여전히 분산은 발산하므로 중간값이 이 분포의 어떤 특징을 '대표'해주는가 하는 문제는 남아 있네요.