얼마 전에 게재 승인되었다고 했던 논문이 제 모습을 갖추어 나왔다[링크]. 논문 제목은 위에 있지만 굳이 한국어로 옮겨보면 "손전화 서비스 사용의 시공간적 상관"이다. 한국어로 옮기니 영 어색하다.


이 일은 작년 봄에 시작했다. 우리 학교 통신및네트워킹학과에서도 참여하는 오따시즐이라는 프로젝트가 있다. 우리 학교 학생이나 직원 중에서 자원한 사람들에게 스마트폰을 제공하되 스마트폰 이용내역을 모두 기록하여 사용패턴을 연구하겠다는 것이다. 물론 기본적인 사적 정보는 보호되지만 그래도 엄청 자세한 데이터다.


폰이 켜져 있기만 하면 일정한 시간 간격으로 가장 가까운 기지국 정보를 기록하며, 또한 폰이 이동하여 기지국이 바뀔 때에도 역시 초 단위 해상도로 기록한다. 각 기지국은 고유한 코드로 구별되는데 이 코드를 기지국의 실제 위치, 즉 경도/위도에 대응시키기 위해서는 또다른 데이터가 필요하다. 이걸 무료로 제공해주는 싸이트가 있는데 하루 내려받기 제한이 있어서 한 2주는 매일 이 데이터 받는 일을 하기도 했다. 결과적으로 약 180명의 사용자들이 최장 16개월 동안 어떤 경로로 움직였는지가 상세히 파악되었다.


사용자가 폰으로 이용하는 전화, 문자, 이메일, 앱, 웹싸이트 등이 역시 초 단위 해상도로 기록된다. 전화, 문자, 이메일의 경우 상대가 누구인지만 암호화되어 남는다. 앱과 웹의 경우 어떤 앱을 이용했는지 어떤 웹싸이트를 방문했는지가 기록된다. 이런 스마트폰 사용 기록은 위에 말한 시공간 궤적과 연관지어 분석될 수 있었다.


나를 비롯한 우리 그룹은 데이터 수집에 아무 역할도 하지 않았고, 통신및네트워킹학과에 소속되어 저 프로젝트에 참여한 연구자가 저 데이터를 들고와서 우리와 함께 분석하는 방식으로 공동연구가 이루어졌다. 이번 일은 전형적으로(?) 데이터가 이끈(data-driven) 연구였는데, 연구질문이 먼저 주어진 후 그에 맞는 데이터를 모은 게 아니라, 데이터가 주어진 상태에서 연구질문을 찾는 순서였기 때문이다. 그렇다... 뭔가 이상하다;;


데이터에 익숙해지는 시간이 기본적으로 필요한데다, 연구질문을 찾는 과정 역시 지난하다보니 중간에 다른 일들에 비해 우선순위가 낮아지는 경우가 많았다. 그러다 올해 들어서야 어떻게든 마무리를 하자고 하여 머리를 쥐어짜면서 논문을 썼고, 사실 부족한 점이 너무 잘 보였지만 일단 제출하기로 했다;;; 다행히도 심사위원을 잘 만났다. 어떤 심사위원은 A4 용지 몇 장에 걸쳐서 조목조목 문제점을 지적했고, 우리도 거의 모든 사항을 성실히 수용하여 논문이 훨씬 나아졌다. 이외에도 내용을 보완하기 위해 이런저런 분석을 더 해봤고 그중 일부는 논문에 포함시켰다.


이런 과정을 통해 마침내 논문이 나와서 좋긴 하지만, 다시 냉정하게 보면 논문을 통해 전달하고자 하는 내용이 여전히 산만하고 명쾌하지 않아서 좀 부끄럽다;;; 그럼에도 긍정적으로 보자면, 우리 연구를 바탕으로 다른 누군가가 한 걸음 더 나아갈 수 있지 않을까 기대해본다. 끝.