며칠 전에 썼듯이 바라바시의 <링크>를 다시 읽고 있었는데 조금 전에 다봤습니다. 2002년에 나온 책이고 한국어 번역판도 2002년 10월 24일이 초판 1쇄 발행일입니다. 제가 이번에 본 책은 올 2월에 발행된 초판 13쇄입니다. 책이 처음 나온 후로도 지난 8년 동안 네트워크(연결망) 이론이 엄청 많이 연구되었는데 개정증보판이 나오면 어떨까 하는 생각을 해봅니다. 그런데 그러면 책이 엄청 두꺼워지겠군요. 게다가 바라바시 교수도 똑똑한 사람이라지만 그 모든 네트워크 연구를 혼자서 다 정리하기도 힘들지 않을까 모르겠네요.

책은 '첫 번째 링크'인 서론부터 '마지막 링크'인 결론에 이르기까지 모두 15개 '링크'로 구성되어 있습니다. (그럼 노드는 몇개?;;;) 순서대로 따라가면서 정리해볼까요.

1. 서론
최근에도 뉴스에 나온 디도스(DDoS; distributed denial of service) 공격에 관한 얘기가 책의 첫머리를 장식하고 있습니다. 2000년 2월 7일 야후 싸이트를 디도스 공격한 15세 소년(일명 마피아보이)에 관한 얘기입니다. 그 소년은 어떻게 그런 큰 일을 벌일 수 있었을까? 간단히 말해서 네크워크의 힘이라는 것이죠. 또다른 예로 바울의 기독교 전파에 관한 이야기. 바울이 사회적 네트워크를 효과적으로 사용할 줄 알았기에 가능한 일이었다는 얘기를 합니다.

2. 무작위의 세계
레온하르트 오일러가 쾨니히스베르크의 다리 문제를 해결하면서 그래프 이론이 시작됩니다. 20세기에는 폴 에르되스와 알프레드 레니의 무작위 그래프에 관한 연구가 큰 자리를 차지하고 있습니다. 그들은 복잡한 그래프가 지닌 "다양성을 의도적으로 논외로 하고 자연이 따를 수 있는 가장 단순한 해결책"으로 '무작위 연결'을 제안했다고 합니다.

노드들이 주어져 있으면 아무거나 두 개를 골라서 일정한 확률로 연결을 시키는 거죠. 연결시킬 확률이 낮으면 연결된 노드들, 즉 덩어리(cluster; 책에서는 '클러스터'로 표기)가 별로 없거나 있더라도 그 덩어리 크기(연결된 노드의 개수)가 작습니다. 그 확률이 높다면 거의 대부분의 노드가 커다란 덩어리에 포함되겠죠. 아주 소수의 노드만이 따로 작은 덩어리를 형성하고 있을 겁니다. 그 확률이 너무 작지도 너무 크지도 않다면, 다시 말해서 거의 대부분의 노드를 포함하는 커다란 덩어리가 나타나기 시작하는 순간의 확률은? 이게 네트워크에서 스미기(percolation) 문제입니다.

여튼 무작위 연결 이론에 의해 사람들은 "복잡성과 무작위성을 동일시"하는 영향을 받았다고 합니다. 물론 그렇지 않다는 게 네트워크 이론뿐 아니라 다른 분야에서도 제기되었고 또한 연구되고 있습니다.

하나만 더 밑줄을 긋고 가겠습니다. "그들(파티에 초대된 사람들)은 이내 서로 이야기하기 시작할텐데, 이는 만나서 서로 알고자 하는 인간의 태생적인 욕구 때문이다."

3. 여섯 단계의 분리
헝가리 문학계의 천재로 여겨진 카린시가 1929년에 단편소설집을 냈는데, 그 중 <연쇄>라는 글에는 "지구상의 15억 주민들 중 아무나 한 사람의 이름을 뽑았을 때, 다섯 명 이하의 지인의 연쇄적인 친분관계를 통해 자신이 그에게 연결할 수 있다고 장담했다"는 구절이 있다고 합니다. 이게 바로 "여섯 단계의 분리(six degrees of separation)"로 우리에게 잘 알려진 개념을 처음 공식적으로 출판한 것이라네요.

1967년 스탠리 밀그램 교수는 미국에서 실제 실험을 통해 이를 증명해보이죠. 여튼 우리는 이런 "좁은 세상(small world)"에서 살고 있습니다. 이를 수학적으로 표현하면, N개의 노드로 이루어진 네트워크에서 임의의 두 노드 사이의 평균 거리가 log N에 비례한다고 합니다.

이건 인터넷 네트워크에서도 나타나는 현상인데요, 당시 연구 결과 19단계만 거치면 수억개의 웹페이지들이 연결된다고 합니다. 하지만 우리는 실제로 더 빨리 원하는 문서를 찾곤 합니다. 모든 링크를 따라가기보다는 단서들을 적절하게 '해석'하기 때문이지요. 여기서도 밑줄 하나 그으면, "끊임없이 서로 접촉하고자 하는 사람들의 추구"에 의해 좁은 세상이 되었다고 합니다.

4. 좁은 세상
1960년대 후반에는 하버드 대학의 사회학에서 네트워크에 대한 관심이 일기 시작했다네요. 그라노베터는 "약한 연결의 힘(The strength of weak ties)"이라는 논문에서 노동시장에서 직업을 구하는데 친구가 아니라 그냥 아는 사람의 도움이 크다는 결과를 발표합니다. "약한 연결들은 외부 세계와 의사소통을 하려고 할 때 결정적인 역할을 한다. (중략) 그들(가장 친한 친구들)은 나와 같은 서클에 있으므로 대개 동일한 정보를 갖고 있을 경우가 많기 때문이다. 새로운 정보를 얻고 싶으면 우리는 약한 연결을 사용해야 한다."라고 합니다.

그의 주장은 무작위 네트워크와는 달리 완전연결 그래프(모든 노드가 서로 연결된 덩어리)들이 약하게 연결되어 전체를 이루는 것으로 봅니다. 던컨 와츠와 스티븐 스트로가츠는 덩어리 계수(clustering coefficient)라는 양을 제시하고 이를 여러 실제 네트워크에 대해서 측정함으로써 에르되스-레니의 무작위 네트워크가 실제 네트워크의 덩어리 성질을 반영하지 못한다는 것을 보입니다. 이들은 1998년에 <네이처>에 좁은 세상 효과와 덩어리 구조를 모두 갖는 모형을 제시하여 네트워크 연구를 촉발시키게 되죠.

여기서도 밑줄 하나. "사람들은 친근함, 안전, 익숙함 등을 주는 파벌(clique)과 클러스터(cluster)를 형성하고자 하는 태생적인 욕구를 갖고 있다."

5. 허브와 커넥터
"우리의 웹 지도 만들기 프로젝트의 결과 중 가장 흥미로운 점은 웹에는 민주주의, 공정성, 평등성이 완벽하게 존재하지 않는다는 것이다. 웹의 위상구조는 저기에 널려 있는 수십억의 문서들을 모두 똑같이 볼 수만은 없게 만든다."

저자는 웹의 구조를 연구하면서 소수의 웹페이지(허브/커넥터)만이 매우 많은 들어오는 링크를 가지며, 대부분의 웹페이지는 매우 적은 수의 들어오는 링크를 갖는다는 사실을 확인합니다. 헐리우드 배우 네트워크에서도 허브들이 존재하며, 이들로 인해 배우들 사이의 거리가 매우 짧아집니다. 또한 많은 영화에 출연한 배우일수록 다른 배우들과의 평균거리가 짧아집니다. 그런데 그게 항상 옳은 것은 아닌데, 포르노 배우의 경우 엄청나게 많은 영화에 출연해도 네트워크 전체에서는 중요한 위치를 차지할 수 없습니다. "네트워크 전체에서 진정으로 중심적인 위치를 차지하는 것은 여러 개의 큰 클러스터들에 동시에 속해 있는 노드들이다."

여튼 이런 허브의 존재는 에르되스-레니의 무작위 네트워크뿐 아니라 와츠-스트로가츠의 좁은 세상 네트워크에도 발견될 수 없는 현상이어서, 새로운 모형을 요구하게 됩니다. 그래서 바라바시 교수가 척도 없는 네트워크 모형을 제시합니다.

6. 80/20 법칙
드디어 거듭제곱 법칙(power law)이 나오네요. 관련하여 파레토가 제시한 80/20 법칙도 지금은 너무나 잘 알려져 있죠. (그가 "80/20"이라는 표현을 사용한 적은 없다네요.) 여튼 다양한 실제 네트워크에서 각 노드가 갖고 있는 링크의 개수, 즉 이웃수의 분포를 그리면 거듭제곱 꼴이 나옵니다. 무작위 네트워크나 좁은 세상 네트워크에서는 대부분의 노드가 비슷한 이웃수를 갖습니다. 그 네트워크의 이웃수 분포에 특정한 규모, 즉 잘 정의된 평균값이 있다고 말합니다.

하지만 대부분의 노드는 이웃수가 매우 작고, 소수의 노드는 엄청나게 큰 이웃수를 갖는 네트워크에서는 대개 그런 '평균' 이웃수는 별 의미가 없습니다. 예를 들면, 국민소득 1만달러라고 해도 여전히 인구의 대부분이 가난에 허덕이는 경우가 있겠죠. 평균보다는 편차가 현상을 이해하는데 더 효과적인 경우입니다. 거듭제곱 분포에는 특정한 규모/척도(scale)가 없으므로, 이웃수가 거듭제곱 분포를 보이는 네트워크를 척도 없는 네크워크라고 부릅니다.

거듭제곱 법칙은 질서 상태와 무질서 상태 사이의 상전이에서 일반적으로 발견되는데, 그래서 특히 통계물리학자들이 지대한 관심을 갖고 연구해왔습니다. 그래서 거듭제곱 꼴의 이웃수 분포는 뭔가 재미있는 일이 벌어지고 있다는 신호로 보이는 거죠.

7. 부익부 빈익빈
이런 실제 척도 없는 네트워크를 위한 가장 단순한 모형을 제시하기 위해 바라바시는 성장과 선호적 연결을 도입합니다. 실제 네트워크에서 노드는 끊임없이 생성됩니다. (물론 사라지기도 하죠.) 그리고 새 노드는 기존 노드에 무작위로 연결되지 않고 이웃수가 많은 노드에 연결되려는 선호(즉 부익부)를 갖습니다. 이 두 요소를 도입함으로써 척도 없는 네트워크 모형이 탄생됩니다.

처음부터 노드 개수가 고정되는 모형들과 달리 성장 모형은 네트워크의 '진화'에 대해서도 통찰할 수 있게 해줍니다.

---
쉬었다가 여덟 번째 링크부터는 다음 글에...