작년 여름 국제통계물리학회에 참석했다가 오랜만에 본 엄박사께서 재밌는 주제를 얘기해 주셨다. 나도 흥미가 생겨서 어찌어찌 공동연구를 하게 되었고 그 결과 4월에 논문이 출판되었고 기세를 이어 며칠 전에 후속논문이 출판되었다.
첫 논문의 제목은 "복잡 연결망에서 일반화된 우정역설: 과학 공동연구의 경우"다. 우정역설 또는 친구역설이라 함은 "내 친구들이 나보다 평균적으로 더 많은 친구를 갖는다"라는 문장으로 나타낼 수 있다. 나만해도 내 친구 중에 친구가 엄청 많은 사람, 즉 허브들이 몇 명 있는데 이들이 나의 '친구들의 친구수의 평균'을 확 올려놓는다. 그 허브들의 친구라면 대개 같은 상황일 것이고 그래서 '대부분의 사람들'에게 적용되는 역설이다. 물론 그 허브들에게는 대체로 적용되지 않는다.
이런 현상은 사람마다 친구수가 다르기 때문에 생기는 건데, 한마디로 표본추출 편향(sampling bias)이라고도 한다. 이는 1991년 사회학자 펠드가 처음 연구한 주제로서 최근에 사회연결망 데이터가 풍부해져서 관련 연구가 다시 주목을 받고 있다.
엄박사는 이 우정역설을 일반화했다. 즉 "내 친구들이 나보다 평균적으로 더 좋은 특성을 갖는다"고 할 수 있다. 물리학자와 연결망과학자들의 연결망으로부터 우리는 "내 공동연구자들이 나보다 더 많은 공동연구자와 일했고, 나보다 더 많은 논문을 썼고, 나보다 피인용지수가 더 높다"는 것을 보였다. 왜 그럴까 하면, 위에서 말한 허브들이 대체로 더 활동적이고 더 좋은 정보를 얻고 그래서 더 성과가 좋거나 잘 산다고 볼 수 있다. 물론 '잘 산다'는 가치 판단의 기준에 따라 달라지기도 하겠지만, 일단 좀 단순화해서 말했다.
연결망 수준에서는 이런 식으로 깔끔하게 설명되지만 각 개인 수준에서는 좀더 복잡한 얘기가 끼어든다. 그래서 그걸 더 자세히 공부한 결과를 정리하여 아래 논문을 썼다.
이번 논문은 모형 연구다. 이웃수가 높은 노드들끼리 연결되는 경향을 가진 연결망을 끼리끼리 연결망이라 부르자. 이웃수와 특성의 정도(이를테면 피인용지수)가 양의 상관을 갖는 경우, 음의 상관을 갖는 경우 등을 생각해볼 수 있다. 그런데 어차피 끼리끼리라 양의 상관이든 음의 상관이든 이웃들끼리 대개 특성의 정도가 비슷하다. 그래서 노드들이 우정역설을 느끼는 정도가 상대적으로 덜 하다.
반면에 이웃수가 높은 노드들이 이웃수가 낮은 노드들과 연결되는 경향이 있는 경우를 보자. 허브들끼리 뭉치기보다는 허브들이 외톨이들하고만 연결되어 있는 그림을 떠올리면 된다. 이때에는 이웃수와 특성의 정도가 양의 상관을 가지면, 즉 허브는 부자고 외톨이는 가난하다면, 외톨이들이 우정역설을 느끼기 더 쉽다. 반대로 허브가 가난하고 외톨이들이 부자라면, 허브들만 우정역설을 느낄 것이다.
사실 결과는 직관적으로 당연하기 때문에 어려운 얘기는 아니지만, 우리는 간단한 경우를 해석적으로 풀어냈고, 이에 기반하여 복잡한 경우의 결과를 이해함으로써 일반화된 우정역설의 이해를 깊게 하는데 기여했다.
---
2015년 8월 17일 오후 2시 46분 덧붙임.
위글과 관련된 내용이 아시아태평양이론물리센터 웹진 크로스로드에 실렸음. [링크]