예전부터 몇번이나 말한 적이 있어서 다 읽고나서 정리를 하려고 했지만, 책상 한구석에 올려놓은 채 방치하고 있었습니다. 그렇다고 지금 잘 정리하려는 건 아니고요;; 책의 마지막 부분에 간단하면서도 재미있는 예가 있어서 한두개 소개하는 걸로 마치려고 합니다.

책 295~300쪽에 '두 번이나 지고서도 이기기 - 심슨의 모순'이라는 재미있는 모순이 소개되어 있는데요, 두 도시에서 기존 의약품과 신상 의약품을 실험하는데 각 실험에 대해 성공률을 구해서 비교합니다. 두 도시 모두에서 기존 의약품이 성공률이 높게 나옵니다.

그런데 이 두 도시의 데이터를 합쳐버리면, 신상 의약품의 성공률이 높게 나오는 신기한(?) 결과가 나옵니다. 그래서 두 도시에서 두 번이나 졌는데 최종적으로는 이기게 된다는 모순인거죠. 말로만으로는 안되고 숫자를 좀 봐야 합니다.

(이 책의 다른 부분에서 몇 번이고 강조하듯이 임상실험의 결과를 통계적으로 믿을 수 있으려면 그 실험 회수가 많아야 하는데, 저는 여기서 그런 것보다도 그냥 산수가 어떻게 되나가 더 재미있어서 일부러 가장 간단해 보이는 예를 다시 찾았습니다.)


각 부등식은 각 도시에서의 결과를 의미합니다. 각 부등식에서 좌변은 기존 의약품의 성공률, 우변은 신상 의약품의 성공률입니다. 두 도시 모두에서 기존 의약품의 성공률이 조금씩 높습니다. 그런데 두 도시의 데이터를 합치면 어떻게 될까요?


신상 의약품의 성공률이 조금 더 높게 나옵니다. 아무런 데이터 '조작'이 없었고 기존의 실험결과를 그대로 이용했는데도, 두 도시를 따로 비교한 결과와 두 도시를 합쳐서 비교한 결과가 정반대라는 겁니다.

여기서는 근소한 차이로 반대 결과가 나오게 했지만, 책에서는 오차범위 내에서 유의미한 차이를 보여주는 숫자들이 이용되었습니다. 쨌든 숫자야 만들기 나름이고요. 저런 예를 보여주는 숫자들이야 얼마든지 찾을 수 있겠죠.

책에서는 실험 집단 사이의 불균등한 분포를 잘 살펴봐야 한다는 식으로 논의를 펼치고 있고, 또 그런 주장이 정당화되는 사례들을 제시하고 있는데요, 그런 지적은 당연히 옳지만, 만일 두 도시가 거의 똑같은 환경에 놓여 있었다고 한다면, 우리는 신상 의약품의 효능에 대해 어떤 평가를 내려야 하는 걸까요.

극단적으로 두 도시의 조건이 동일하다면, 두 도시에서의 성공률을 따로 재는 게 적절한지, 합쳐서 재는 게 적절한지를 묻는 겁니다. 두 도시가 아니라 두 번의 동일한 조건의 실험이라고 하고, 각 실험에서 테스트의 회수가 균일하지 않은 경우에 위와 같은 결과가 나왔다고 해도 마찬가지죠.

물론 처음부터 각 도시의 각 의약품에 대한 샘플의 수를 똑같이 맞춰서 실행하면 저런 '모순'은 발생할 수 없습니다. 그냥 단순한 산수인데 너무 과도하게 해석하려는 건지 모르겠지만, 아직까지는 뭔가 재미있게 느껴집니다.

책에 있는 내용을 하나만 더 소개하면요, '아무것도 바뀌지 않더라도, 모든 것이 더 나아진다'라는 소제목의 글입니다. 이를테면, 소선거구제라고 합시다. 어떤 정당이 인구가 모두 똑같은 세 선거구에서 각각 100%, 50%, 0%의 지지율을 얻고 있습니다. 간단히 나타내면, 서부: (+ +), 중부: (+ -), 동부: (- -) 이런 상황인거죠.

어느날 이걸 중선거구제로 바꾼다고 합시다. 서부와 중부를 합쳐서 '중서부' 선거구로 만들고 동부는 그냥 내버려둡니다. 그러면 정당 지지율은 중서부(+ + + -)에서 75%, 동부(- -)에서 여전히 0%입니다.

이게 맘에 들지 않은 이 정당은 국회에서 날치기로 새로운 선거구제로 바꾸는 법안을 통과시킵니다. 서부를 원래대로 독립시키고, 대신 중부와 동부를 합쳐 '중동부' 선거구를 만든거죠. 그럼 서부(+ +)에서 지지율은 100%인데, 중동부(+ - - -)에서는 25%가 됩니다.

시민들은 자신들의 의견을 전혀 바꾸지 않는데도, 선거구를 어떻게 정할 거냐에 따라 그 결과는 크게 달라질 수 있습니다. 특히 위에서 말한 정당의 지지율은 날치기 통과 전 75%, 0%에서 날치기 통과 후 100%, 25%로 각각 25%씩이나 상승하는 효과를 보는 거죠.

이제 이 책은 책꽂이에 꼽아놓거나 주변 사람들에게 읽어보라고 빌려주거나 해야겠습니다. 밤이 늦었네요.가 아니라 제가 늦은 거죠;;; (주어를 명확하게 해야...)