2007년 11월 17일에 올렸던 글(http://exactitude.tistory.com/299)을 수식만 스프링노트에서 새로 써서 다시 올립니다. 원래 글은 비공개로 돌렸고 덧글은 따로 옮기지 않겠습니다.

---

작년에 피지컬 리뷰 E에 실린 게스트너와 뉴만의 논문을 간단히 소개하려고 한다. 원래 제목은 'Optimal design of spatial distribution networks'인데 한국어로 옮기니 위 제목처럼 좀 딱딱해졌다. (하긴 영어도 딱딱하군.) 미국의 지역별 인구수와 병원, 우체국, 주유소 등 시설(facility) 사이의 상관관계에 대한 실증적인 연구이다.

쉽게 생각하면 인구가 많은 동네/지역일수록 더 많은 시설이 필요하고 또 들어서 있을 것이다. 위치 r에서의 인구밀도를 ρ(r)이라고 하고 시설의 규모를 D(r)이라고 하면 D(r) ~ ρ(r)2/3이라고 한다. 이는 실제로도 그렇고 간단한 전제로부터 수식을 이용해서도 얻을 수 있다.

위치 r에 사는 사람들은 자신의 거주지로부터 가장 가까운 시설을 이용한다고 가정한다. 어떤 2차원 영역 위에 p개의 시설이 r1, r2, ..., rp 라는 위치에 건설되었다고 하자. 목적함수는 다음과 같다.

$$f(r_1,r_2,\cdots,r_p)=\int \rho(r)\min_{i=1,\cdots,p} |r-r_i|dr$$

위 식 중간의 min 부분은 위치 r에 있는 사람과 시설 i와의 거리, 즉 |r - ri|가 최소가 되는 시설을 이용하겠다는 뜻이다. 모든 위치 r에 대해 시설의 번호 i를 정할 수 있다. 그리고 그 위치 r에서의 인구밀도 ρ(r)을 알므로 이를 모든 r에 대해 적분하면 f가 된다. f가 최소가 되는 시설의 위치는 어떤 분포를 따를까.가 문제다.

각 시설을 이용하려는 사람들은 그 시설 근처에 살 것이고 그 사람들의 거주 영역을 정할 수 있다. 그 영역은 조밀(compact)하므로 영역의 면적 s와 그 영역의 지름 r 사이에는 s ~ r2 의 관계를 갖는다. 여기서 r은 시설의 위치와 거주자 사이의 거리에 비례하므로 위 적분 식에서 min 부분에 해당한다. min 부분이 r에 비례하므로 곧 s1/2에 비례한다.

$$f\sim \int \rho(r)s(r)^{1/2}dr$$

시설 하나를 이용하는 사람들의 거주지 면적이 s(r)이므로 시설의 밀도는 1 / s(r)이고 이 밀도를 모든 r에 대해 적분하면 시설의 개수 p가 나올 것이다.

$$\int s(r)^{-1}dr=p$$

라그랑지 곱수 방법(Lagrange multiplier method)을 이용하여 f를 최소(즉 최적)로 만드는 s(r)을 찾을 수 있고 시설의 밀도를 D(r) = 1 / s(r)이라고 하면 곧바로 D(r) ~ ρ(r)2/3이 나온다.

[옮긴이(=나) 주: 그대로 쓰려다 자세한 설명이 필요할 것 같아 덧붙입니다;;;

$$f=a\int\rho s^{1/2}dr+\lambda\left[\int s^{-1}dr -p\right]$$

$$\frac{\partial f}{\partial s}=\frac{a}{2}\int\rho s^{-1/2}dr-\lambda\int s^{-2}dr=0$$

$$\frac{a}{2\lambda}\rho= s^{-3/2}=D^{3/2}\ \therefore D\sim \rho^{2/3}$$

한결 낫네요.]

사람들이 공간적으로 가까운 시설을 이용한다는 고려를 하지 않고 인구에 비례하는 시설을 짓는다면 D(r) ~ ρ(r)이겠지만 위의 결론에 따르면 시설이 남아돌게 된다. 반면에 인구밀도를 고려하지 않고 그 지역의 면적에만 비례하도록 시설을 짓는다면 D(r) ~ ρ(r)0 ~ 상수이므로 역시 시설의 불균형이 초래될 것이다. 최적의 해답은 지수가 2/3인 경우다.

이미 1977년에 정부 기관의 수와 인구밀도의 상관관계에 관해 여러 나라의 자료를 비교검토해서 0.66이라는 숫자가 나온 연구가 있다고 한다. 이 값이 바로 2/3이며 그만큼 시설의 분포가 최적화되어 있다고 말할 수 있다.

실은 오늘 이 논문의 제1저자로부터 발표를 들었는데, 발표를 듣고나니 이 2/3라는 숫자는 2차원 공간 위에서만 성립하고 당연히 시스템의 공간차원에 따라 달라질 거라는 생각이 들었다. 그래서 만일 인류가 우주로 진출해서 3차원 공간에서의 연결망을 생각한다면 어떤 숫자가 최적일까를 생각해보았다. 답은 간단하다.

앞에서 어떤 조밀한 영역의 넓이와 지름 사이의 관계가 s ~ r2이었고 바로 이 2라는 숫자로부터 2/3이 유도되어 나왔다. 그러므로 일반적으로 s ~ rd라고 하면 d / (d + 1)이 나온다는 것을 알 수 있다. 2차원에서는 2/3이고 3차원에서는 3/4가 될 것이다. 우리가 더 높은 차원에 산다고 하고, 내친 김에 무한한 차원의 공간에 산다고 하면 d가 무한대이고 위 지수는 1로 수렴한다. 즉 무한한 차원에서는 D(r) ~ ρ(r)이 되므로 인구수에 비례하는 시설을 지으면 바로 최적의 해답이 된다.

만일 이 세계가 그렇게 조밀하지 않고 프랙탈 모양이라면 위에서 d는 자연수가 아니라 실수가 되는 것도 가능해진다. 그때도 역시 지수는 d / (d + 1)이고 여기서 d는 실수를 넣으면 역시 최적의 답이 나온다.

한 가지 궁금한 것은 어떻게 시스템이 지 알아서 2/3로 찾아갔느냐 하는 것이다. 시설이 필요하면 짓고 아님 말고였을테고 게다가 정부나 건설업자들이 2/3라는 숫자에 맞추기 위해 일부러 조절을 하지는 않았을 것이다. 사실 논문을 제대로 읽어보지 않아서 이런 내용이 논문에 있는지는 모르겠다. 어쨌거나 이것도 일종의 자기조직화 현상으로 볼 수 있겠다는 생각이다. 끝.

* 2007년 11월 19일 오후 2시 37분 덧붙임: Michael Gastner 홈페이지 (새 주소로 고쳤음.)

* 2010년 4월 28일 오후 11시 42분 덧붙임: 위 마지막 문단에 대한 의견을 덧붙입니다. 이 연구는 "이용자 이동거리 최소화"라는 전제로부터 거듭제곱 지수가 2/3라는 결과를 이끌어내고 있습니다. 정부나 업자들은 2/3라는 값을 몰랐겠지만 "이동거리 최소화"라는 전제를 분명히 의식하고 행동했을 수 있습니다. 그리고 0.66이라는 거듭제곱 지수는 이미 1977년에도 실증적으로 확인되었습니다.

전제로부터 결과를 이끌어내기 위해 여러 방법이 이용될 수 있는데, 이 연구처럼 손으로 풀 수도 있고 행위자기반모형을 이용할 수도 있겠죠. 어느 방법이 더 현실을 반영하느냐 또는 현상을 이해하는데 더 나은 직관을 주느냐라고 묻는다면 일단 둘 다 중요하다고 생각합니다. 하지만 아무래도 손으로 풀어내는 것이 현상을 이해하는데 더 좋다고 주장하고 싶은데, 손으로 푼다고 해도 그 '의미'를 제대로 이해하지 못한다면 이게 더 우월하다고 주장할 근거가 약해집니다. 여기까지가 꼬마지리학자님과 열띤 토론을 해서 얻은 제 나름의 결론입니다.