어쩌다가 랭카스터 환경센터의 키쓰 베벤 교수가 2012년에 <하이드롤로지컬 프로세시스(Hydrological Processes)>에 출판한 짧은 글(commentary)을 읽게 되었다. 제목은 "그래서 너의 오류는 얼마나 인지적인가? 일본과 이탈리아로부터의 교훈"이다. 언제나 그렇듯 내멋대로 간단히 정리하려고 한다.


글쓴이는 불확실성을 우연적인 것과 인지적인 것으로 나눈다. '우연적'은 aleatory를 한국어로 옮긴 것인데 위키피디아에 따르면 "통계적 불확실성"으로도 알려져 있다고 한다. '인지적'은 epistemic을 옮긴 것으로 역시 위키에 따르면 "체계적 불확실성"으로 알려져 있다고 한다. 우연 또는 우연적 불확실성은 그 불확실성을 줄일 수 없는 자연적 가변성의 형태를 갖는단다. 반면 인지 불확실성은 지식이 부족해서 생긴 불확실성을 가리킨다. 다시 말해서 알아도 어쩔 수 없는 불확실성이냐 몰라서 생긴 불확실성이냐의 차이다.


통계이론은 대개 알아도 어쩔 수 없는 우연적 불확실성을 다룬다고 한다. 즉 확률 또는 확률분포로 표현할 수 있는 대상이라는 말이다. 인지적 불확실성은 그것이 역시 일관된 확률로 표현되는 경우에만 다루어질 수 있다. 하지만 인지적 불확실성이 언제나 확률적이지만은 않다고 하는데, 그러면서 2009년 이탈리아 지진에 관한 얘기를 소개한다.


"주요위험 예측예방을 위한 이탈리아 국가위원회"에 속한 6명의 지리과학자들이 지진이 일어난 지역주민에게 적절한 경고를 하지 못했다는 이유로 재판을 받은 사건이다. 예측에는 불확실성이 따를 수밖에 없는데 문제는 그 예측에 근거하여 정책적 결정(주민에 대한 대피명령)이 내려져야 한다는 사실이다. 이탈리아 검찰은 이 재판에서 문제가 되는 건 예측의 불확실성 자체가 아니라 (피고인들이) 위험을 지나치게 강조한 사실에 있다고 한다.


하여간 인지 문제로 가면 다양한 인간 요인들이 작용해서 상황이 복잡해진다고 한다. 기상이나 재난에 대한 예측이 잘 되는 경우라도 사람들이 경고에 어떻게 반응하는지 등이 중요한 차이를 만들기도 한다. 하지만 또 우연과 인지를 구분하는 게 실제로는 어렵다. 그런데 그런 구분이 중요하지 않다는 관점도 있다. 어떤 불확실성이든 확률적으로 다뤄지기만 하면 되고, 실제 오류에 기반해서 모형을 수정하면 된다는 생각이다.


그런데 이건 또 너무 단순한데, 인지적 불확실성은 일관된 통계모형으로 이해되기 쉽지 않기 때문이다. 이를테면 확률분포 자체가 시간에 따라 변할 수 있다(non-stationary). 2011년 일본 도호쿠 지방의 지진도 그런 사례다. 이미 그 지역에서 지진이 여러번 있었고, 그래서 후쿠시마 핵발전소 주변의 홍수대비시설을 설계하는데 과거 기록들이 이용되었다. 연간초과확률(AEP)을 0.000001로 잡았는데 이는 1백만년에 한번꼴로 사건이 생긴다는 말이다. 탈렙은 "낮은 확률의 위험은 언제나 과소평가된다"고 했다고 한다.


낮은 확률 위험은 말 그대로 별로 일어나지 않는 일이기 때문에 데이터가 제한되어 있다. 또한 통계적인 규칙도 없고 비정상적(non-stationary)이며, 과거에 일어난 일이 미래에도 일어나리라는 보장이 없다. 과거 경험으로부터 우리가 모을 수 있는 조언은 다음과 같다.


1. 인지 불확실성에 관한 유일한 안내는 과거에 일어난 일로부터 얻어질 수밖에 없다. 물론 더 커다란 놀라운 사건들이 일어날 가능성은 늘 있다.


2. 놀라운 사건들은 비선형동역학에 내재되어 있으므로 과거가 좋은 안내가 될 것이라고 단순히 가정할 수 없다. 


3. 단순한 확률분석은 그 분포가 두꺼운 꼬리를 가지는 경우 미래의 위험을 과소평가할 수 있다.


4. 그러므로 인지적 불확실성을 다루는 문제는 통계문제라기보다는 관리문제다. 실제로 AEP를 결정하고 조정하는 건 과학보다는 정치적 편의를 위한 결과인 경우들이 있다.


뭐 대충 이런 내용이다. 끝.