시간에 따른 사건들로 이루어진 시계열을 어떻게 분석하고 이해할 것인가라는 문제를 계속 공부하고 있다. 각 사건에 관해서는 그 사건이 일어난 시각만 알고 있다고 하자. 이를 시간에 따른 함수로 표현하면 x(t)로 나타낼 수 있는데, 사건이 일어난 시각 t에서 x=1이고 그외에는 x=0이다. 이로부터 자체상관함수(autocorrelation function)를 재보면 이 시계열의 기억효과가 드러난다. 장기 기억효과가 있는 경우 대체로 거듭제곱 꼴로 감소하는 자체상관함수가 나타나는데 이 거듭제곱 지수를 \(\gamma\)라고 하자.


또 재볼 수 있는 양은 사건 사이 시간 분포다. 한 사건과 다음 사건 사이의 시간간격을 ‘사건 사이 시간(inter-event time)’이라 부르고, 이들을 모아서 분포를 만들면 된다. 많은 데이터에서 이 분포가 거듭제곱 분포라는 것이 알려져 있다. 이때 이 거듭제곱 지수를 \(\alpha\)라고 하자. 사건 사이 시간의 편차가 큰 것만으로 이미 이 시계열에 내재한 기억효과가 강하다는 것을 알 수 있다. 하지만 이를 넘어서서 사건 사이 시간 사이의 기억효과도 잴 수 있다. 이를 위해 시계열을 이루는 사건들을 사건 덩어리들로 묶을 수 있다. 각 사건 덩어리에 포함된 사건의 개수를 셀 수 있는데, 이를 폭발적 사건열의 크기 또는 줄여서 폭발성 크기(burst size)라고 부르자. 폭발성 크기의 분포도 거듭제곱 분포라는 것이 최근에 밝혀졌는데, 아직 논란이 좀 있다. 어쨌든 이 거듭제곱 분포의 거듭제곱 지수를 \(\beta\)라고 하자.


자체상관함수는 시계열에 포함된 기억효과를 거의 다 그대로 보여준다고 할 수 있다. 이 기억효과를 사건 사이 시간의 특성만으로 이해할 수는 없고, 사건 사이 시간 사이의 상관관계까지 알아야 제대로 이해할 수 있다는 게 내 주장이다. 그래서 우리의 질문을 단순화하면, \(\gamma\)가 \(\alpha\)와 \(\beta\)의 함수로 나타날텐데, 그 모양이 어떻냐는 것이다. 손계산으로 우아하게 구해보면 좋겠지만... 안되니까 일단 컴퓨터로 실험을 해보기로 했다. 그 결과로 논문을 썼고 얼마 전에 출판되었다. 참고로 생애 첫 단독저자 논문이다. 주요 결과는 아래 그림에 요약되어 있다. 가로로 된 점선은 사건 사이 시간들이 서로 상관이 없을 때(\(\beta\) 값이 무한히 큰 경우에 해당) 얻어진 \(\gamma\) 값을 나타낸다. 보다시피 \(\alpha\)가 2 이하일 때와 2보다 클 때의 행태가 다르다. 왜 그런지는 모른다. 몰라서 더 연구를 해야 한다.


오랜만에 블로그에 글을 쓰려고 했더니 어떻게 써야할 지 까먹어서 일단 여기서 마친다...