새 논문이 나왔다. 어쩌다보니 계속 폭발성에 관한 일을 하고 있는데 어쨌든 이번 일도 일단락이다. 이번 논문은 상관 폭발성(correlated bursts)에 관한 모형 연구다. 이 일을 언제 시작했더라? 작년 여름에 핀란드로 출장 갔을 때였던 것으로 기억이 난다. 상관 폭발성은 카르샤이 등에 의해 2012년 <사이언티픽 리포츠>에 처음 소개된 이후로 연구가 잘 이루어지지 않은 현상이다. 그 논문에서는 여러 데이터를 분석한 결과 상관 폭발성이 있음을 보였고 간단한 모형을 제시하기도 했다. 그런데 그 모형이 아주 깔끔하지는 않아서 다른 접근을 시도했고 아주 기본적인 경우는 해석적 결과도 얻었지만 일반적인 경우는 전산모사(시뮬레이션)를 통해 연구했다.
상관 폭발성은 무엇인가? 우선 그냥 폭발성은 사건 사이 시간의 분포만으로 기술되곤 했다. 사건 사이 시간은 하나의 사건이 일어나고 그 다음 사건이 일어날 때까지의 시간을 뜻한다. 즉 사건 두 개의 관계에 관한 것이다. 이걸 연달은 세 개의 사건 사이의 관계로 확장할 수 있다. 즉 하나의 사건 사이 시간과 바로 다음 사건 사이 시간 사이의 상관관계를 재보면 시계열의 기억 효과를 더 잘 알 수 있는데, 이미 '기억계수'라는 양이 제시되어 쓰이고 있다. 그럼 연달은 네 개의 사건 사이의 관계나 연달은 열 개의 사건 사이의 관계는 어떻게 잴 수 있을까?
물론 기억계수를 확장해도 되지만, 카르샤이 등은 '사건 열(event train)'이라는 개념을 제시했다. 한 사건이 일어나고 일정한 시간 간격(이걸 Δt라고 부르자) 안에 또 다른 사건이 일어난다고 하자. 그 두번째 사건 이후 역시 같은 시간 간격 안에 또 다른 사건이 일어난다. 이게 몇 번 더 반복되다가 그 다음 사건은 Δt가 지나도록 일어나지 않는다고 하자. 그럼 Δt라는 기준으로 봤을 때 앞에 말한 사건들이 '연달아 일어난다'고 가정하자는 것이다. Δt를 기준으로 '묶인' 사건들을 하나의 '사건 열'이라 부르는데, 각 사건 열에 포함된 사건의 개수를 E로 나타낸다. 지진, 신경세포의 발화, 핸드폰 데이터에서 잰 E의 분포가 모두 거듭제곱 분포를 보인다는 것이다.
사건 열의 분포가 거듭제곱 꼴이라는 것이 상관 폭발성의 핵심이다. 카르샤이 등은 '두 상태 모형'을 만들었는데 한 상태에서는 일반적인 폭발성을 만들어내고 그러다 일정한 확률로 다른 상태로 넘어가서 사건 열을 만들어내다가 다시 일정한 확률로 원래 상태로 돌아가서 일반적인 폭발성을 만들어낸다. 즉 사건 열이 시작되는 지점이 분명하다. 하지만 실제 현상에서는 사건 열이 언제 시작하는지가 분명하지 않을 수도 있다. 그래서 우리는 스스로 흥분되는 점 과정(self-exciting point process)류의 모형을 만들었다. 특히 지진 시계열 분석 및 예측 분야에서도 많이 쓰이는 모형과 비슷하다. 솔직히 지진 분야에서 이런 모형이 그렇게 많이 연구되는줄 몰랐다가 논문을 거의 다 쓰고나서야 뒤늦게 알게 되었다.
이제 본론;;으로 들어가서, 우리 모형을 설명하겠다. 사건이 하나 일어났다고 하자. 그럼 시스템은 그 사건을 기억한다. 하지만 그 기억은 시간에 따라 줄어든다. 같은 방식으로 그 이전 사건도 기억하고... 과거 모든 사건에 대한 기억이 남아있을 수도 있다. 매 순간 이런 기억의 총량을 계산할 수 있고, 바로 그 총기억이 커질수록 다음 순간에 새로운 사건이 일어날 확률이 커진다. 이게 다다. 하지만 많은 시스템은 과거의 모든 사건을 기억할 수 없으므로 우리는 '기억상실 메커니즘'을 모형에 추가했다. 이건 기존 지진 연구의 모형들에는 없는 거라고 한다. (심사위원이 그랬음;;;) 아래 그림은 그렇게 얻은 총기억량의 시간에 따른 변화를 나타낸다. 여튼 이런 방식으로 상관 폭발성이 나타남을 확인했다. 그럼 여기까지.