지난주 금요일에 연구실 저널클럽에서 내가 정리하여 발표한 논문을 소개한다. 바라바시 그룹에서 최근 아카이브에 올린 논문인데 다음과 같다.


C. Song, D. Wang, A.-L. Barabasi, Joint Scaling Theory of Human Dynamics and Network Science, arXiv:1209.1411 [링크]


이 논문에서 말하는 '인간동역학'은 사건 사이 시간의 분포가 거듭제곱 꼴인 현상을 가리키며, '연결망과학'은 연결망 구조에서 발견되는 다양한 거듭제곱 분포를 뜻한다. 거듭제곱 분포는 이를 특징짓는 거듭제곱 지수로 간단히 표현할 수 있다. 그래서 이 논문에서는 동역학의 거듭제곱 지수와 연결망의 거듭제곱 지수 사이의 관계식을 유도하고 이를 실제 데이터로부터 검증하는 내용을 다룬다.


물론 연결망 구조와 동역학적 특징을 하나의 틀로 보고자 하는 시도가 이전에 없었던 것은 아니지만 각 현상의 거듭제곱 지수 사이의 눈금잡기 관계식을 제시한 것은 이 논문이 처음인 것 같다. 그래서 논문제목이 '결합눈금잡기이론'이다.


행위자 A가 그의 친구들인 B, C, D, E 등에게 핸폰으로 전화를 건 목록을 다음처럼 써보겠다.


...BCDCBEDDECB...


A가 B에게 전화를 걸고 다시 B에게 전화를 걸 때까지의 '시간'을 실제 시간이 아닌 그 두 사건 사이에 일어난 다른 사건들의 개수로 정의한다. 즉 첫 B부터 다음 B까지의 사건 사이 시간은 3이 되고 두번째 B부터 마지막 B까지의 사건 사이 시간은 5가 된다. 이렇게 '실제 시간' 대신 '사건 시간'을 다룸으로써 인간의 일간/주간 활동에 의한 영향을 애초에 논의에서 제외해버린다. 앞으로 '시간'은 이렇게 사건 시간을 뜻한다.


시간 \(t_1\)부터 \(t_2\)까지 B에게 전화를 걸지 않았다가 그 다음에 B에게 걸 확률은 A에서 B로의 사건 사이 시간이 적어도 이 구간 \((t_1,t_2)\)보다는 클 확률과 같다. 이 확률을 Π라고 하고, 이 구간의 길이를 이 구간 동안 이 행위자의 활동성, 즉 세기라 부르며 \(C(t_1,t_2)\)로 쓸 것이다. 또한 사건 사이 시간 분포, 즉 P(τ)의 거듭제곱 지수는 \(1+\beta\)라고 쓴다.


$$\Pi(t_1,t_2)=\int_C^\infty P(\tau)d\tau \sim C^{-\beta}$$


이 확률은 이 구간 동안의 이웃수 k와 노드 세기 C의 관계를 통해 얻을 수도 있는데, 일반적으로 어떤 구간을 잡든지 다음과 같은 거듭제곱 관계가 있음이 데이터를 통해 발견된다.


$$k(t_1,t_2)\sim C(t_1,t_2)^{\alpha} $$


Π는 위 구간 동안 B에게 전화를 걸지 않았다가 '새로' B에게 전화를 걸 확률인데, 이는 C가 1만큼 늘어날 때 k도 1만큼 늘어날 확률로 보면 된다. B에게 새로 걸었으니 이웃수가 1만큼 늘어났다고 보는 것이다.


$$\Pi(t_1,t_2)\approx \frac{dk}{dC}\sim C^{\alpha-1}$$


저 위에서 구한 식과 방금 구한 식은 같아야 하므로 거듭제곱 지수 사이의 다음 관계식이 얻어진다.


$$\alpha+\beta=1$$


이로서 동역학에 관련된 거듭제곱 지수 β와 연결망 구조에 관련된 거듭제곱 지수 α 사이의 관계식이 얻어졌다. 이제 이로부터 다른 관계식도 유도해낼 수 있다.


알고 나면 별거 아니라고 말할 수도 있겠지만, 역시 바라바시라는 생각이 든다. 우선 실제 시간이 아니라 사건 시간으로 동역학을 정의함으로써 일간/주간 활동에 의한 영향에 관한 논란을 피해갈 수 있었을 뿐 아니라 사건 사이 시간을 곧바로 각 행위자의 활동성에 연결지어 군더더기 없는 관계식을 유도해냈다. 영리한 접근이다.


또한 내가 이 글에서는 일부러 명시하지 않았지만, 위 거듭제곱 지수들은 모두 각 개인에 대해 정의되어 사람에 따라 다른 값을 가지지만 그럼에도 위의 눈금잡기 관계식은 누구에게나 성립한다고 한다. 이 역시 서로 다른 특성을 갖는 사람들을 뭉뚱그릴 때 생길 수 있는 문제를 애초에 만들지 않는 접근방식이다.


뭐 그렇슴;;