공부

두꺼운 꼬리에 대한 인상

Seldon 2014. 10. 6. 20:20


"로그정규분포와 거듭제곱분포의 꼬리의 느낌이 좀 다른데 거칠게 말해보자면, 큰 사건이 일어날 법하다(로그정규), 큰 사건은 반드시 일어난다(거듭제곱)."


어제 생각난 건데 보충설명이 필요하다는 생각이 들어서 블로그에 써보려고 한다. 우선 확률분포가 두꺼운 꼬리를 갖는다고 할 때는 흔히 '지수함수적 감소'보다 느리게 줄어드는 경우를 가리킨다. 지수함수 분포는 exp(-x) 꼴이다. 정규분포의 경우 꼬리가 더 빨리 줄어드는데 exp(-x^2) 꼴로 주어지기 때문이다.


로그정규분포의 경우 정규분포에서 x를 ln x로 변수변환한 형태인데 계수 같은 거 다 빼고 함수 형태만 쓰자면 exp(-(ln x)^2) * 1/x 꼴이다. 변수변환을 해주면서 1/x가 붙는데 이게 중요하다. 이것 때문에 로그정규분포도 두꺼운 꼬리를 갖기 때문이다. 하지만 여전히 정규분포의 모양을 x축으로 좌악 늘였다고 봐도 되며 애초 모양이 종모양이었으므로 '늘어난 종모양'으로 볼 수도 있다. 이를테면 원래 가는 꼬리(thin tail)였는데 억지로 늘려서 두꺼운 꼬리로 만든 거다;;;


반면에 거듭제곱 분포의 경우 일반적으로 1/x^a 처럼 쓸 수 있다. 이 함수형태는 애초에 자기유사성의 수학적 표현임을 보인 적이 있다(이전 글 참고). 즉 x가 아무리 커져도 전체와 비슷한 모양이 계속 나타나며, 꼬리의 끝에 같은 모양의 꼬리가 크기만 작아진채 계속 이어져 있다고 볼 수 있다. 그래서 로그정규분포의 꼬리에 비해 필연적이라는 '느낌'이 든다;;;


바로 이런 차이로 인해서 맨 위에 쓴 것 같은 인상을 받았다. 그리고 거듭제곱의 경우 "큰 사건은 반드시 일어난다"는 말은 내가 처음 쓴 건 아니고 바라바시가 <버스트>라는 책에서 한 표현임을 참고로 밝혀둔다. 


물론 "큰 사건은 반드시 일어난다"가 "큰 사건이 일어날 확률이 1이다"를 뜻하지 않는다. 조금 더 정확히 말하자면 "큰 사건은 언젠가 반드시 일어난다"라고 할 수 있는데, '언젠가'라는 시간규모에 따라 '어느 정도 큰' 사건이 '어떤 확률'로 일어날지에 관한 진술을 할 수 있을 것이다. 물론 그건 x의 분포 P(x)에 모두 포함된 정보이므로 P(x)만 알면 그냥 계산해낼 수 있다.