오랜만에 내 트위터 사용 패턴의 폭발성을 분석해보았다. 예전에도 두 번 해봤던 거다. 트윗을 한 번 올리고 다음 번 올릴 때까지 걸린 시간을 트윗 사이 시간이라 부르자. 이 트윗 사이 시간의 분포는 대개 두꺼운 꼬리를 갖는데 그걸 거듭제곱 꼬리(power-law tail)라고 가정한 후 거듭제곱 지수를 재보니 1.3 근처가 나왔고, 예전 다른 시기의 데이터로 측정한 값과 대동소이하다.



이번에 쓴 데이터는 2013년 4월 29일 저녁 8시부터 2013년 6월 21일 아침 11시까지 내 트위터 계정에 올린 약 700개의 트윗과 RT 등을 포함하고 있다. 하여간 1.3이라는 거듭제곱 지수가 어떻게 나왔을지 맨날 생각해보려고 하다가 그만 둬서;;; 아직도 이해하지 못하고 있다.


---


가만히 생각해보다가 덧붙임. 이런 거듭제곱 분포가 신기한 건 내가 맘대로 조절할 수 있는 게 아니라는 거다. 반면에 트윗 사이 시간의 평균은 조절할 수 있다. 트윗을 줄이면 트윗 사이 시간의 평균이 커질테고, 트윗을 많이 하면 그 반대가 될테다. 이외에도 어떤 통계적 특성은 내가 마음을 먹으면 조절할 수 있겠지만, 저 거듭제곱 지수 1.3이라는 값은 그런 식으로 조절되지 않는다.


내가 트위터를 사용할 때 어떤 특정한 규칙을 염두에 둔 것도 아니다. 걍 내키는대로 하기도 하고 바빠서 못하기도 하고 다양한 요인이 작용한다. 그래서 일정 정도 랜덤한 것 같기도 하고 일정 정도 규칙성이 있기도 하다. 하지만 이 모든 효과가 종합되어 저런 1.3이라는 값을 보여준다. 또 신기한 점은 지난 두 달 동안의 데이터로 얻은 이 값이 2011년 1년 동안의 데이터로 얻은 값과 2012년 여름 두 달 동안의 데이터로 얻은 값과 거의 같다는 것.


그동안 내 생활이 크게 달라지지 않았으니 비슷할 거라고 생각할 수도 있다. 그런데 지난 2주 동안 학회에 참석해서 폭풍트윗을 한 결과가 지난 두 달의 데이터에 포함되어 있다. 즉 평상시의 데이터와 폭트를 포함한 데이터가 같은 1.3이라는 값을 보여준다는 말이다.


그래서 이 1.3이라는 값은 뭔가 내가 모르는 나에 대해 말을 해주는 것 같은 느낌이 든다. 그런데 그게 과연 뭘까? 이래서 재미있는 문제가 된다. 물론 지금까지 이를 설명하기 위한 여러 모형들에 비추어 생각해볼 수 있다. 하지만 그런 모형들은 너무 단순해서... 내가 만든 모형으로도 나의 이런 패턴을 설명할 수 있을 거라는 생각이 안든다;;;