오늘로써 국제연결망학회(NetSci2013)가 끝났다. 2년 전 부다페스트에서 열린 같은 학회에 갔다가 너무 정신이 없어서 이번에는 아예 아무런 기대 없이 왔다. 마음을 비우니 좀더 여유있게 들으면서 조금 더 다른 면들을 생각해볼 수 있었다. 연결망학회이니만큼 연결망도 연결망이지만 데이터를 어떻게 생각할 거냐 하는 문제에 대한 생각을 정리해보려고 한다.


우선 지금까지 내가 다룬 데이터는 대개 주어진 것이었다. 그렇다보니 어떤 문제를 연구할 것인가라는 연구질문보다 이 데이터로 어떻게 분석할 것인가라는 방법에 관한 질문을 먼저 할 수밖에 없었다. 그렇다보니 데이터에 끌려다니게 되고 그래서 동기도 부족해지고 열정도 그만큼 생기지 않은 것 같다. 예전부터 data-driven research를 어떻게 번역할지 아리까리한 적이 많았는데 이제야 제대로 된 말을 찾은 것 같다. 즉 "데이터에 끌려다니는 연구"다;;;


물론 이건 내 경험일 뿐이며 얼마든지 잘 하는 사람들도 많다. 특히 이런 학회를 올 때마다 그런 사람들이 많다는 걸 알게 된다.


그래서 든 생각은 제대로 해보고 싶다는 거다. 연구질문을 먼저 만들고 거기 맞는 데이터를 내가 직접 발로 뛰며 구해봐야 데이터가 소중하다는 것도 알게 되고 더이상 끌려다니지 않고 내가 주도한 연구가 되지 않을까 하는 생각이 들었다. 물론 이게 쉽게 될 거라고 생각하지 않는다. 하여간 늘 첫 질문은 이거다: "그래서 네가 알고 싶은 게 뭔데?" 즉 연구질문을 어떻게 설정할 것인지... 벌써 한숨이 나온다.


연구질문을 찾았다고 가정;;하자. 그 다음부터는 정말 어려운 일이 될 것이다. 사회과학자들이 해온 방법을 일단 알아둘 필요가 있을 것 같고 좀더 손쉽게 데이터를 얻을 수 있는 방법을 찾아볼 수도 있을 것이다. 어느 쪽이든 연구질문에 따라 달라지는 얘기라서 더 할 말은 없다. 그러고보니 작년 가을에 하다가 만 일도 데이터를 찾다가 못찾은 적이 있구나. 사실 페이스북 데이터만 공개되어 있으면 되는 거지만서도;;; 그게 안되니깐.


연구질문이 없거나 불명확한 상태에서 데이터 연구를 하려다보니 이런 문제가 생겨서 점점 더 내가 하기 편한 모형연구에 집중해왔던 것 같다. 하지만 이것도 또 회피이기 때문에 문제에 맞서서 이겨내든 이 위에 올라타고 흐름에 몸을 맡기든 뭐든 해야 하는데, 왜 이런 문제가 생겼는지 이제 조금 알 것 같다. 이 동네 와서 처음 쓴 논문은 연구질문이 분명했고 좋은 데이터도 있어서 그만큼 성공적인 편이지만 그 이후로 계속 뭔가 감을 제대로 잡지 못하고 있었다.


생각해보니 이번 학회에서 발표한 모형도 여기에 맞는 데이터를 찾다가 못찾아서 결국 데이터 분석 없이 마무리했구나;;; (내가 정신이 없음.) 내 발표를 들은 지인들이 자신이 분석했던 데이터 얘기를 해주면서 관심을 보여서 나중에 같이 뭔가 해보기로 한 성과를 얻기도 했다. 그러고보니 전혀 기대하지 않고 와서 이것저것 얻은 게 많은 학회였다. 이게 결론임;;;