'개인의 이동패턴 이해하기'는 지난 주 <네이처>에 나온 바라바시 그룹의 논문 제목을 한국어로 옮긴 거다. 알고는 있었는데 안 보고 있다가 오늘 세미나에서 다른 분이 발표를 해주셔서 보게 되었다.

6개월 동안 10만명의 핸드폰 기록을 이용하여 사람들이 어떻게 움직이는지를 분석한 내용이다. 정확한 위치까지 알아낼 수는 없고, 그 핸드폰으로 전화를 걸거나 받거나 문자를 보내거나 받을 때마다 그 정보가 거쳐간 중개기(router? 논문에는 the tower routeing the communication이라고 나와 있다.)의 위치가 기록된다. 이걸 이용해서 사람들의 이동경로를 대체적으로나마 추적할 수 있다. 이것만으로는 부족하다 싶었는지 1주일 동안 206명의 핸드폰을 두 시간마다 체크한 데이터를 이용하기도 한다.

먼저번 통화할 때의 위치와 그 다음번 통화할 때의 위치 사이의 거리를 r이라고 하면 r의 분포는 잘린 거듭제곱 꼴(truncated power-law)이 된다. 즉 P(r) = (r + a)^(-β) exp(-r / k) 와 같은 꼴이 된다. 주어진 데이터로 a, β, k를 측정할 수 있고 이때 β는 1.75 정도 나온다고 한다.

그리고나서 회전 반지름(radius of gyration)을 정의하는데 이건 한 핸드폰을 들고 돌아다닌 범위가 대략 어느 정도 되는지를 측정하는 양이다. 이 회전 반지름의 분포도 역시 잘린 거듭제곱 꼴이 나온다고 한다. 즉 대부분의 사람들은 좁은 영역에서만 지내고 소수의 사람들은 매우 넓은 영역을 돌아다닌다는 말이다.

이런 패턴을 이해하기 위해 여러 가지를 시도해본 결과, 사람들이 마구잡이로 걷는다고(random walk) 볼 수 없고 그렇다고 레비 비행(Levy flight)을 한다고 볼 수도 없다고 한다. 그보다도 뭔가 균질하지 않은 속성들이 개입하는 것 같다고 하는데 보충자료(supplement)를 보지 못해서 모르겠지만 논문 본문에는 그냥 그런 것 같다.하고 넘어간 것 같다.

이 논문을 통해 사람들은 몇 개의 특정한 지점에 주로 머문다는 것이 밝혀졌는데, 당연히 집과 직장을 비롯한 몇 개일 것이다. 가장 자주 머무는 위치를 순서대로 1,2,3 ...으로 번호를 매기고 각 번호에 머무는 회수 및 시간의 분포를 계산할 수 있는데 그러면 지수가 -1인 거듭제곱 꼴, 즉 지프 법칙(Zipf's law)이 발견된다고 한다.

어찌 보면 너무도 당연한 결과다. 말했듯이 집과 직장을 비롯한 몇 군데에서 대부분의 시간을 보내며 핸드폰을 이용하는 빈도의 분포도 그에 영향을 받을 거다. 또한 집과 직장 사이의 거리가 정해져 있으면 대충 그 언저리에서 돌아다닐 것이므로 정해진 위치의 직장을 다니는 대부분의 사람들이 좁은 영역에서만 머물 것이고 그렇지 않은 사람들은 소수일 것이다. 말로 써놓으면 이렇게 당연해보이지만, 그런 활동 범위(회전 반지름)의 분포가 잘린 거듭제곱 꼴이라는 걸 실제 데이터로 밝혀냈다는 데 의의가 있다고 하겠다.

하나 더 얘기하면, 활동 범위의 모양이 둥근 모양인 사람도 있고 길쭉한 사람도 있을 것이다. 이런 비등방성을 데이터로부터 측정할 수 있는데 활동 범위가 넓은 사람일수록 비등방성이 크다고 한다. 이를테면, 집과 직장 사이의 거리가 먼 사람일수록 집과 직장만 왔다갔다 한다는 말이다;;; 출퇴근 시간이 길고 피곤해지니 다른데 놀러갈 시간/여유가 없는 거라고 나는 이해했다. 그리고 결국 그런 상황일 거라고 생각한다.

관련 기사들을 보니 인권 침해의 논란이 있다고 하던데 그럴 수 있겠다 싶다. 데이터가 어디서 나왔는지 같은 문제는 확실히 해둬야 할 것 같다.