제가 학회 내내 발표내용을 트윗에 올렸다고 했죠. 그걸 캡콜드님께서 첩스토리에 정리해주신 걸 그대로 긁어왔습니다. 그리고 불필요한 리트윗 정보 등은 지웠습니다. 140자로 제한된 트윗이다보니 음슴체도 많이 쓰고;;; 좀 지저분해 보일 수도 있습니다.
아 모형 이름은 Naming game(이름짓기게임). 합의에 이르는 과정은 정보의 확산, 또는 마구잡이걷개로 거칠게 이해할 수 있고 그런 모형에서 나타나는 r^2 ~ t로부터 거듭제곱 관계가 기본적으로 내재해있다고 추측할 수 있음.
다음으로 RPI의 지만스키(?) 발표: 명확한 의견을 가진 소수의 영향. 마가렛미드를 인용하면서 시작. '명확한 의견을 가진'은 곧 '절대 의견을 바꾸지 않는 행위자'로 모형화됨.
모형연구에 따르면 명확한 의견을 가진 사람들이 전체 인구의 10% 정도만 되어도 시스템 전체가 그들의 의견을 따를 것이라는 결과. 10%보다 크면(작으면) 합의에 이르는 시간이 행위자수에 로그(지수)함수로 증가.
다슌왕의 발표. 어떤 기업(?)의 8천명 직원의 이메일과 이멜 전달에 관한 데이터를 이용하여 정보흐름에 관한 연구를 발표중. 이메일 내용!도 이용하여 분석했다고 함.
모형연구를 위해 갈튼-왓슨 가지치기 과정을 적용. 하지만 이웃수에 따라 가지치는 회수가 영향을 받는다고 가정하는 듯.
카스테야노의 전염병 확산 모형 발표 듣는 중. SIS모형 등에서 확산문턱값이 척도없는 연결망의 이웃수분포에 따라 0이 될 수도 있다는 기존 연구들에 관한 소개. 문턱값은 이웃행렬의 최대고유값, 절단이웃수 등에 의존하며, 평균장접근만으로 한계...
어떤 경우에는 연결망의 척도 없음보다 지속적인 전염원으로 기능하는 허브의 존재가 더 중요할 수 있다는 결론인 듯.이 아니라 초록에 그렇게 써 있음-_-
잠시 쉬고, 주최자인 코니스의 '노이즈 환경의 연결망에서 시간지연의 영향'에 관한 발표 듣는 중. "생물계에서 임계상태는 외부 자극에 최적으로 반응하기 위해 필요하다"는 인용을 소개.
"시장거래자들은 평상시에는 약한연결/많은소통을 선호, 위기전상황에서는 강한연결/적은소통을 선호" - Saadevra PNAS 2011.
갈로스의 발표: 미국에서 관찰된 비만(obesity)의 지역(county 단위)분포를 스미기과정으로 모형화해서 연구.
툴이 트위터에서 웹앱의 viral adoption(적절한 한글용어를 못찾음;;)에 관한 발표를 시작. 슬라이드 배경이 트위터 고래... 그래서 발표에 몰입이 안됨-_-
모형연구를 위해 SI모형과 바스(Bass)모형(http://exactitude.tistory.com/724)을 소개.
오후 첫세션은 아다믹. 연결망과 내용의 공진화. 지난번 스톡홀름에서 들은 발표에서 봤던 슬라이드도 보이고... 근데 지난번에 들은 내용이 기억이 잘 안남-_-
세컨라이프의 경우, 기존 연결망성질로는 내용다양성(몸짓?등)을 설명하기 힘들고 발표자가 정의한 전도성(conductance)이 좋은 상관관계를 갖는다고.
바랏의 발표: 아노비(www.anobii.com)를 사회연결망분석. 사용자의 거주지나 사용패턴에 따른 상관관계가 발견된다고.
우리그룹의 헝가리포닥 카르사이 발표중. 핸폰통화데이터의 연결망 특성, 폭발성 등이 정보확산에 미치는 영향 및 폭발성의 원인이 무엇인지, 다른 현상에서도 관찰되는 상관된 폭발성에 대해 발표하고 있고 발표할 예정.;;;
40분휴식;; 이후 토로츠카이 발표: 상호성으로부터 끼리끼리효과를 이해하려는 연구. "변수 4개면 코끼리를 맞출(fit) 수 있다"는 말을 폰노이만이 했다고 함. 여튼 관계가 불균형하면 끊음으로써 가장 만족한 상태로 가려는 걸 메트로폴리스MC로 모형화
끼리끼리효과를 최대로하는 '온도'는 임계온도와 다르다는 결과. 하지만 실제 측정값과는 잘 맞는다고.
다음 발표는 사회심리학자 쉬베텔스키(?;;;). 제목은 "은행,돈,군집,확산; 가십에서 패닉으로"
은행이 작은 마을에 분점을 낼 때 잡담(gossip)과 사람들의 연결망이 어떤 영향을 주는지를 인터뷰 등을 통해 조사하여 분석했다고. 색다르게;; 슬라이드 없는 발표.
경제학자(?) 추하이의 발표: "친구를 통한 마케팅: 끼리끼리 효과가 있는 사회연결망에서 정보확산". 요즘 경제학자의 책을 보다보니 수식의 느낌이 낯익다.
우지의 발표: 비전형적인 지식과 과학적 아이디어의 적용. 제목 맞나?;;
전통과 혁신을 적절히 조합해야 성공율이 높아진다라는 걸 논문의 인용연결망으로부터 보임. 논문의 인용분야에 따라 한분야논문부터 다분야논문으로 구분한 후 이들의 인용지수를 비교한 결과 같은 결론에 도달.
1인저자논문보다 여러명저자논문이 더 많이 인용된다고.
여러저자논문은 다른 경우에 비해 항상 가장 덜 전통적이었다고.
netsci2011 본 학회 시작. 첫 발표는 로바스. 제목이 정확히 기억나지 않는데 "큰 연결망의 수학적 접근" 비슷한 듯;;; 학회홈페이지와 나눠준 행사일정을 아무리 뒤져봐도 플레너리세션 발표제목을 찾을 수 없다-_-
원래(?) 노드가 짝수개인가, 링크밀도는 얼마인가, 연결되어 있는가 등을 봤다고 하는데, 인터넷 같은 큰 연결망에서는 노드가 짝수개인가 같은 질문을 할 수도 없다고. 링크밀도가 큰 경우는 많이 알려져 있지만 작은 경우는 아직 덜 알려졌다고
그래서 샘플링을 통한 연구도 한다고. 그리고 최대자르기문제(max-cut problem)에 대해서도 샘플링에 관한 결과를 간단히 소개한 듯. 이 문제는http://en.wikipedia.org/wiki/Maximum_cut 참고.
스메레디 분할(?). 노드 사이의 '유사성'을 두 노드로부터 두 단계 거리에 있는 노드를 공유(?)할 기대값으로 정의하고 이를 이용해 유사성이 입실론 이상인 노드들의 집합을 구한 후... 놓쳤다-_- 여튼 최대자르기 알고리즘 설명임;;
다음 문제로, 링크밀도가 1/2인 그래프에서 4-순환의 개수를 최소로 하는 문제를 소개. 랜덤그래프에서 이 값은 1/16보다 크다고 하는데 아마 4-순환의 밀도인 듯? 하지만 최소가 얻어지진 않고, 그래서 그래프한계를 볼 필요가 있다고.
성긴(sparse)연결망엔 좋은 그림이 없고 여러가지 극단적인 경우가 있고 해석(?)도 다양하고...하지만 많은 뻔하지 않은 결과들이 있다고. 그런 예(?)로 최대흐름(maximum flow)문제 소개 http://bit.ly/jKVOJR
다음으로 곤잘레스 발표. http://cee.mit.edu/gonzalez 발표제목은 "다섯 도시 이야기"
질문: 사람들은 얼마나 멀리 이동하는가? 그런 행동에 클러스터가 있는가? 비교연구대상은 리스본, 산토도밍고,키갈리,샌프란시스코,보스톤. 그래서 '다섯 도시 이야기'인 듯.
핸폰 이용할 때 연결된 기지국의 지리정보를 이용하여 사람들의 이동성을 연구. 이동거리는 핸폰이용량(?)과 무관하다고. 이동거리분포는 바이불 분포에 맞추는 듯. 각 도시마다 분포 모양이 다르지만 같은 함수를 써서 측정된 파라메터 비교.
다음으로 사람들의 핸폰이용에 관한 시간패턴을 클러스터링(PCA + k-means). 사용자가 있는 건물이 학교냐 사무실이냐 이런 정보를 주로 이용하는 것 같은데...;; 그리고 그렇게 얻은 클러스터의 인구학 정보를 결합해서 설명.
30분 휴식 후 비첵의 발표: 연결망 위계의 발현. "위계는 최적화된 구조"? 정보흐름, 생산, 의사결정과정 등의 최적화? 이런 문제를 다루려는 듯.
"복잡성은 랜덤과 규칙의 중간에 있다." 연결망도 마찬가지. 다양한 층위의 연결망이 위계+랜덤한 덩어리로 이루어져 있다고 보는 게 현실적.
방향성 없는 연결망에서 위계란 나무(tree)구조를 말하는 게 아닌가. 방향성 있는 연결망에서는 방향성 있는 사이중심성이 중요.
실제 사례로 캠프에 참가한 학생들 사이의 의사결정에서 위계가 발현, 비둘기무리가 날면서 위치를 조정하는 패턴이 생각만큼 단순하지는 않다는 관찰결과 소개. 비둘기 이동경로로부터 상관함수를 측정하여 지연시간이 +냐 -냐에 따라 방향성이 결정.
누군가의 질문에 비둘기의 리더는 집까지 최단경로로 오는 새라고 함. 이런 설명이 좀 부족한 듯. 이런 '최적화' 원리를 밝혀내는 일이 앞으로 중요할 듯.
마르티네즈의 발표: "통계학이 환원주의과학에 필수적인 것처럼 연결망은 종합과학에 필수적인가?" 번역이 맞나?;;; 여튼 생태학자라고 함.
생물다양성, 소비자-자원 상호작용, 연결망의 구조와 기능... 고먹이사슬(paleofoodweb) 연구, niche 모형... 연구실에서 두 종 사이의 인구동역학 연구, 소비자-자원의 몸크기비율이 종의 지속성에 영향(뭐라는겨?;;)
포식자 몸크기가 피식자 몸크기보다 10배나 100배 정도 클 때 종이 더 오래 지속한다는 말 같음.
독일(?) 어떤 호수의 생태계(24종) 사이의 연결망을 고려하여 실제 각 종의 연중 생물량 변화 패턴을 잘 예측할 수 있었다는 것 같은데 구체적인 내용은 모르겠음;;
고기잡이의 경제적 효과... 물고기를 많이 잡을수록 관련 종의 생물량이 줄어드는게 일반적(?)인데 잠깐 증가하는 영역이 있다고. 이를 hydra (Jesus?) effect라고...
이런 결과들을 인간-자연연결망에 적용할 수 있는가?라는 질문. 그러면서 Panarchy라는 말이 나왔는데 어디서 들어본 적 있는 것 같은데 어디서 들었더라.
오후는 평행세션. '기본 넷싸이(basic netsci)'를 들으려 1층 오디토리움에 옴. 첫 발표는 아띨라의 "협력연결망의 흥망". 연결망+게임 모형연구인 듯. 마틴 노박도 공동저자.
무슨 게임을 하겠다는 건지 못봄;; 여튼 가장 보수가 높은 노드가 자신을 복제하고(변이율도 도입), 그 노드의 연결관계를 상속받음. 노드가 새로 생기면 랜덤 노드 하나 제거해서 시스템 크기 유지... 잘 뭉쳐있던 협력자그룹이 배반자들이
생기면서 링크가 많이 끊긴 연결구조로 바뀌는 듯. 너무 빨리 지나가서 모르겠음...;;;
구조가 견고하면 평균보수가 낮고, 구조가 불안할 때 평균보수가 높아진다고. 견고함과 보수를 모두 최대화하기 힘들다고.
이동성(mobility) 세션 들으러 409호에 옴. 페이지랭크에서 특정 페이지의 랭크를 올리는 알고리즘을 정확하면서 빠르게 할 수 있는 '정책되풀이' 알고리즘을 제시한 발표가 방금 끝나고 이상훈 @lshlj 발표 시작.
이상훈 박사의 발표: 욕심많은 탐험가(navigator)로 공간연결망 탐색하기. 목적지와 지리적으로 가까운 노드로 움직이는 것만으로는 문제가 있음. 일종의 국소적 최적에 갇히는 듯.
연결망을 2차원 평면 위에 시각화한 후 노드의 지리정보에 기반한 탐험 알고리즘. 그리고 "길이 막히면 돌아가기" 규칙을 추가하여 목적지에 잘 찾아갈 수 있음. 이런 내용 맞나?;; @lshlj
실제 도로연결망에서 특정 길을 막음으로써 교통이 개선된다는 브라스 역설에 대한 설명중. 링크필수성(edge essentiality)을 정의... 링크의 사이중심성이 높아도 필수성이 낮은 경우도 있다고 함. @lshlj
욕심많은 탐험자를 가장 효과적으로 놀려먹는게 미로임을 보여줬음. 지난 스톡홀름 학회에서 상훈이 포스터 발표를 보고 나도 미로를 생각한 적이 있음.^^ @lshlj
오후 두번째 평행세션, 이동성2. 첫 발표는 우리그룹의 라즈가 "이동통신연결망에서 시간경로와 패턴"을 주제로 하고 있음. 지금은 "작지만 느린 세상(small but slow world)"라는 논문내용을 소개중.
다음으로, 시간에 따라 변하는 연결망에서 정보(또는 승객)이 전달되는데(여행하는데) 걸리는 시간 등을 실제 핸폰통화, 비행기운행시간표 등을 바탕으로 연구. 핸폰통화의 경우 영모형보다 느리게 정보전파, 비행기경우 영모형보다 빠르게 승객여행.
페트리의 발표. 런던 도로에 수만개(?) 센서를 깔아서 각 센서 위를 지나간 차의 수(~흐름), 센서 위에 차들이 머문 시간(~밀도)을 15분 간격으로 측정.
센서들 사이의 상관관계, 파워스펙트럼 모두 거듭제곱 관계를 보여줌. 후자의 경우 '임계상태'의 표지... 그래서 그런지 발표제목도 critical London. 이외에도 교통흐름 연구의 '기본그림(fundamental diagram)'재현
미시기본그림은 지금까지 알려진 거랑 비슷한데(밀도가 커지면서 흐름도 커지다 줄어듬), 각 센서에 대해 평균을 낸 거시기본그림은 미시의 앞부분만 관찰된다고...(즉 밀도에 따라 흐름이 커지기만 하고 끝.) 왜 그럴까.
시미니의 발표. "두 장소 사이를 오가는 사람(commuter)의 수를 예측할 수 있는가?" 지프의 '최소노력의 원리', 중력모형을 소개. 교통량~두장소의 인구의 곱/거리의 거듭제곱꼴.에서 인구에도 거듭제곱을 붙이거나 거리의 함수형태를 지수함수로 개선
여튼 중력모형의 단점을 보완하기 위해 방사모형(radiation model)을 제시하고 이게 실제데이터와 더 잘맞는다는 걸 보여줌. 장소 사이의 거리보다 인구수가 더 중요하다는 결론.
다음으로 울리의 발표. 9/11 등 큰 사건들이 공항 사이의 운행에 미치는 영향을 연구. (무선연결이 됐다 안됐다... temporal link라서 트윗 타이밍이 중요.)
9/11의 경우 북미-중미 사이의 영향만 주를 이루었지만, 아이슬란드 화산폭발의 경우 유럽-아프리카 사이 영향도 컸지만 다른 대륙들 사이에도 비교적 큰 영향을 미침.
학회트윗중계까지 하려던 건 아니었지만 하게 되었음. 그런데 인터넷 안되니까 짜증나서 오히려 발표를 제대로 듣지 못하는 상황;;; 지금은 옆건물에서 포스터발표 세션중. 이름짓기게임모형을 동역학적 연결망에서 돌린 결과 합의에 이르는 시간이 거듭제곱이라고.
netsci2011 본 학회 둘째날은 우리알론의 발표로 시작: "모듈의 빠른 자발적 성장(?)" 모듈이 아닌 구조가 모듈 구조보다 더 최적일 수도 있다는 얘기로 시작...
생물연결망은 모듈구조. 모티프(motif): 반복해서 나타나는 조절패턴, 모티프는 기능에 연결된다고. 그런데 진화시늉내기는 대개 모듈아닌 구조를 만든다고. 그럼 시늉내기 잘못한 거 아닌가?;;;
유전알고리즘시뮬하는데 입력으로 출력만드는 기능('목표')을 논리회로로 모형화. 논리회로 자체가 변이/crossover로 진화. 적합도는 여러 입력 중 원하는 출력을 만들어낸 비율. 두가지 서로 다른 목표를 동시에 처리하는 걸 만들기도...
(X XOR Y) AND (Z XOR W)와 (X XOR Y) OR (Z XOR W)을 수행하는 회로를 진화시키면 XOR 모듈이 만들어짐. 목표가 고정되면 모듈이 빠르게 사라진다고. 목표가 변하는 경우 해답에 도달하는 시간이 빨라지기도.
목표를 서브모듈의 조합으로 만드는 등, 목표가 복잡해질수록 진화속도도 빨라진다고. 속도개선~복잡성^0.7 (복잡성이 맞나?;;) 왜 그런지 알기 위해 간단한 해석모형을 연구.
적합도지형에서 가까운 곳에 있는 서로 다른 두 봉우리로 올라가는 길을 이리저리 접프하면서 최적화에 가는 시간이 빨라지는데... 그 최종 봉우리는 모듈구조. 그림으로 명확한데 말로 설명하기 힘들다-_-
다양한 환경->다양한 기능의 조합을 요구->다양한 기능이 모듈화되어야 환경변화에 적응하기 쉬워짐->이렇게 발현된 모듈을 새로 조합하여 새로운 환경에서 살아남기 쉬워짐... 재밌다.
누군가 과학자양성에 이 아이디어를 적용할 수 있느냐는 질문을 함. 다양한 주제를 접하면 다양한 하위주제들을 공부할 수 있고 그것들의 조합으로 새로운 연구환경에 적응하기 쉬워지지 않을까;;
드수자의 발표: 폭발적 스미기(explosive percolation). 에르디쉬-레니 연결망의 스미기에 관한 기본내용 소개. 하지만 링크를 만들 때 제약이 있다면? 거대클러스터가 형성되는 걸 지연시키는 규칙을 적용해보자는 것. 스미기전이가 급격해짐.
이 스미기전이가 1차전이냐 약한 연속전이냐 논의가 있었다가 도로고프체프 그룹에서 연속전이임을 보임. 하지만 노드개수가 10^18이어도 여전히 불연속인 것처럼 보임. 하지만 실제 연결망 중 이정도 큰 시스템이 있냐?는 질문을 던짐.
'진짜 불연속'전이인 모형도 있다고. 그러면서 보만-프리츠-보말드(BFW)모형을 소개... 최근 결과에 의하면 두개의 안정한 거대클러스터가 존재. 파라메터를 조절하면 거대클러스터 개수도 조절가능... 등등. 실제 불연속전이 모형도 존재.
도로고프체프가 코멘트중. "작은 시스템에서 컴퓨터 실험으로 한 너네 결과 틀렸어(incorrect)"라고;;;
30분 쉬고 베스피냐니 발표: 상전이와 이동패턴. 사회적원자-사회적분자-사회적집합상태... 주어진 데이터에 기반해서 사회를 예측할 수 있는 도구에 관한 이야기들...로 시작.
전염병 확산에 관한 자세한 데이터를 바탕으로 사람들의 이동패턴까지 고려하여 전세계 차원에서 전염병확산을 '예측'...
연결망의 각 노드를 도시라고 하면 각 노드에 많은 사람들이 있고 사람들이 노드 사이를 여행... 이런 시스템에서 전염병 확산을 연구. 예전에 네이처피직스에 낸 논문 내용으로 기억함.
모형 계산결과 사람들의 이동성이 현재보다 1/10 정도 줄어야 전염병 확산을 막는 효과가 생긴다고. 덧붙여 사람들이 얼마나 '오래' 다른 동네에 있는지도 고려할 수 있다고...
다음으로 팔라의 발표: 여러겹쪽거리(multifractal) 연결망 생성기. 공동저자로 어제 발표자였던 로바스, 비첵도 있음.
어떤 연결망의 노드개수를 무한대로 보내면서 이웃수분포, 삼각형밀도, 실제로 모든 서브그래프밀도가 수렴할 때 이 연결망이 수렴한다고 할 수 있다. [0,1]의 랜덤한 자리에 노드를 뿌리고 두 노드 연결할 확률을 대칭함수 W(x,y)로 가정.
수렴하는 연결망에 대해서 적절한 W(x,y) 형태를 찾을 수 있다는 로바스의 결과 소개. W를 여러겹쪽거리로 바꿔서 성긴연결망에 대해 연구해보자는 듯. x,y각 축을 m개 구간으로 나누면 m^2 박스가 생기고 각 박스에 측정량 p_ij부여
노드개수를 무한으로 보내면서 평균이웃수는 유한하게 하려면 박스로 나누는 회수도 무한해야 함. 즉 연결망의 복잡성도 증가... 이를 통해 다양한 연결망을 만들 수 있고 연결망성질도 계산할 수 있고 등등.
열역학적 극한(노드개수 무한대로 보내는 극한)에서 모든 노드의 이웃수가 똑같지 않으면 고립된 노드의 비중이 1로 수렴한다고. 하지만 실제연결망에서는 큰문제되지 않는다고 함. 아 노드 개수가 유한하면 [0,1]을 다 덮지 못해서 그렇군.
고립된 노드 문제를 푸는 방법으로 W(x,y)를 회전하는 방법을 제시. 회전 각도에 따라 다른 결과... 이 문제가 유한한 노드 개수 문제라면 회전한다고 해결되나. 모르니까 패쓰;; 이제 역으로 원하는 이웃수분포 연결망을 만드는 생성기는?
이웃수분포뿐 아니라 뭉침계수 등 여러 성질을 동시에 만족시키는 연결망생성기 W를 찾을 수 있는가? 더 일반적인 접근이 필요. 여튼 실제연결망에도 적용한 사례 소개로 발표를 마무리하는 중.
첫 두발표(코노버,곤잘레스)는 2010년 미국중간선거(?) 전 6주 동안 수백만 트위터의 정치성향을 분석한 내용이었음. RT는 좌끼리 우끼리 잘 구분되지만 멘션은 막 섞여있었음. 같은 정치성향끼리 뭉치는 정도는 우파가 우세, 링크의 비중은 좌파가 우세
가지치기과정으로 RT 동역학을 모형화해서 연구했는데 좌파가 우파보다 세배정도 더 잘 RT했다고.
홀이스트는 BBC포럼, Digg, blog06에서 모은 수백만건의 코멘트에서 긍정/중성/부정적 감정을 구분하여 분석. 비중이 낮은 감정이 더잘 뭉쳐서 나타남. IRC대화분석결과 대화의 엔트로피 증가하는 경향(중성과 긍정 비중이 가까워짐)
BBC포럼의 경우 부정적 감정에서 시작한 대화가 더 오래감. 긍정적 감정의 경우도 마찬가지로 더 격한 감정에서 시작할수록 더 오래 대화가 지속된다고.
다음으로 리는 "대규모이동전화사회연결망에서 노이즈 제거하기" 발표. 노이즈=스팸,공공서비스,자료수집에서 발생한 불완전정보 등. 아시아 어느 도시 5백만사용자, 3개월 동안 모은 자료 분석.
공공전화번호, 텔레마케팅 통화, 불완전한 사용자 정보일 경우, 다른 도시로 건 통화 등 모두 제거. 일간통화패턴이 다르긴 다르군.
텔레마케팅 자료를 제거하니까 이웃수분포 등이 달라지네. 이게 생각보다 전체 데이터에서 차지하는 비중이 큰가보네. 근데 발표가 여기서 끝.;;; 다른 것도 더 재서 보여주지... 발표자는 석사과정 학생이라고 들은 듯.
잠시 쉬고 '온라인넷2' 세션 시작. 페라의 발표: 트윗에서 던바수(~150) 확인했다는 결과발표. 작년9월에 던바발표듣고 온라인에서는 150보다 더 많은 이웃들이 있는데 어떻게 생각하냐는 질문을 한 적 있었는데, 역시 사람들이 연구를 하고 있었다는;
170만사용자, 3.8억메시지, 방향성/비중(weight) 있는 연결망. 상호작용(메시지)세기가 최대가 되는 이웃수가 100에서 200 사이라고. 메시지받으면 답변할지 안할지 결정, 우선권이 있는 대기(queuing)과정으로 모형화.
모형연구 결과, 대기열의 크기가 상호작용세기의 최대값과 그때의 이웃수 등을 결정. 이건 연결망 고려한 결과인듯. 1인 모형을 만들어서 풀면 실제 결과를 잘 재현한다고.
잠시 쉬고 아만다(?) 발표: 페북 계정 있느냐, 자기 정보 공개하느냐 등을 질문하면서 시작. 링크예측: 과학자사이의 공동연구 링크예측. 기대한 링크중 실제로 나타난 링크비율 PPV로 정의하는데 16% 정도라고.
페북에서 링크예측하려나봄. 페북의 연결망+이멜접촉목록정보로 (페북)멤버가 아닌 사람들이 서로 어떻게 연결되어 있는지 예측하려나봄. 물론 검증할 방법이 없음.
기계학습 이용. 멤버아닌 두 사람 사이의 거리, 뭉침계수 등에 따라 결정나무(decision tree)를 만들어서 이용. 근데 기계학습이 뭔지 몰라서 패쓰;;
쯔바이크의 발표였고 제목은 "1+1=3"이었음. 발표 두 개가 빵꾸난 걸 모르고 헤맸음;;;
마이센의 발표: "사회매체(media)가 인간통신의 복잡한 패턴을 드러낸다"는 제목. 유럽 여러나라의 대학조직에서 직원~교원^1.3 쯤 된다고. 파킨슨법칙?
오슬로대학의 3만이멜사용자의 2천5백만메일에 대해 내부이멜수~업무단위^알파. 알파=1.29(6)쯤 된다고. 위계연결망모형을 만들어서 간단히(?) 풀어서 실증결과를 뒷받침. 말도 빠르고 속도도 빨라서 힘들다-_-
구글에 두 낱말 넣고 검색해서 두 낱말 사이의 '유사성'을 두 낱말이 동시에 들어있는 결과수의 비중으로 정의해서 연결망 만드는 얘기 하다가 갑자기 트위터 얘기로 점프;; 트윗비율의 시계열에서 로그수익 분포도 보고, RT비율은 거듭제곱분포.
기업이름이 트윗(RT가 아니었군;)에서 나타나는 패턴을 앞서 정의한 '유사성'지수를 이용해 연결망을 만들면 클러스터된 결과가 실제 관계를 어느 정도 반영한다고.하는 거 맞나?;; 트윗비율의 분포도 거듭제곱분포인데 대체 왜 거듭제곱일까.
이 1.3이라는 거듭제곱 지수에 대해 생물에서도 사회현상에서도 많이 나타난다는 청중들의 코멘트.
정정합니다;;; '너네 결과 틀렸어'가 아니라 드수자 발표중 어떤 결론이 해석적으로 푼게 아니라 컴터 실험 결과임을 지적하는 얘기였다는군요.
어제저녁 6-7시에 우리알론 교수의 강연이 있었다. 제목은 "랩에서 사랑과 공포" 과학자들은 객관/논리를 추구하다보니 과학자의 주관/감정적인 면을 소홀히 하는 경향이 있다고. 과학자도 실제로 직관을 비롯한 주관적 요소, 동기부여에 관련된 감정적 요소들
에 영향받고 이런 부분을 계발(?)할 필요에 대해 얘기해주었다. 중간중간에 이야기 흐름에 맞는 자작곡을 기타를 치며 불러주기도 하고 청중들이 코러스를 넣기도 하고, 옆자리에 앉은 사람과 연구욕구충만했던 경험을 나누기도 했다.
동기에 작용하는 요인으로 능력,자율,사회적관계 등이 있다는 심리학연구를 소개해주기도. 노래 중에는 열심히 논문을 쓰고 있는데 같은 내용의 논문이 출판된 걸 알았을 때의 상황을 묘사한 것도 있었다. 여튼 몰입해서 들었고 재미/유익했음.
오늘 저녁은 갈라먹는 갈라디너;; '던바수'의 로빈던바 교수가 밥도 못먹고(아마도) 발표. 그동안 우리는 밥이 나와서 열심히 먹으면서 놀멘놀멘 들음;;; 가족은 안정하지만 친구관계는 깨지기 쉽다, 여자들은 대화가 관계유지에 중요한 역할을 하지만
남자들은 활동이 더 중요한 역할을 한다고. 남자들 사이에 대화를 하면 오히려 역효과, 여자들 사이에 활동을 하면 역효과가 난다는 결과를 소개. 통계적으로 얼마나 믿을만한지는 내가 그분야에 무지해서 모르겠;;;
netsci2011 본학회 마지막날. 첫 플레너리세션 발표는 야후의 던칸 와츠. 제목은 "랩의 군대? 아마존 미케니컬 터크에서 연결망 실험들"
실험실에서 군대를 연구할 수 있는지에 대해 69년에 어떤 학자가 실질적으로도 힘들고 불필요하다고 했다고. 하지만 필요하며 미시-거시 문제가 해결되어야 한다고. 우연히 69년에 인터넷이 처음 탄생했고 그후로 상황이 많이 변했다고...
그래서 (인터넷 이용해서?) 새로 밀그램의 좁은세상 실험을 했더니 밀그램과 같은 결과를 얻었다고. 다음으로 사람드에게 음악을 고르게 하되 '독립'조건과 '사회적영향'조건에 놓고 했을 때 사회적영향에서 불평등과 예측불가능성이 높아졌다고.
시장은 사람들의 선호를 드러낼뿐 아니라 형성하기도 한다는 걸 배울 수 있다고. 이런 웹기반연구가 좋긴한데 프로그래밍 많이 해야하고, "꿈의구장"원리에 기대야 하고, 컴터 앞에서 지루해하는 사람들에게 유흥(?)을 제공해야 하고 등등;;
아마존미케니컬터크(AMT)에서 사람들에게 기본금액을 주고 너무 재미있지 않은 일을 맡겨서 잘하면 보너스 지급. 그 성과가 금전적 보상과 어떤 관계가 있는지를 실험함. 이미지 순서정렬하는 일에 대해 611명 참가, 58%가 여성, 수익은다양
결과: 보상이 많을수록 더 많이 일함. 하지만 그게 일의 정확도를 높이지는 않음. 일이 어려울수록 일을 덜 함. 사람들은 늘 자기가 하는 일에 비해 보상을 덜 받는다고 생각.
AMT가 행동과학자들 사이에 인기가 많고 AMT실험가이드도 있다고. 초기 AMT실험은 연결망을 고려하지 않았는데 연결망도 고려하려나봄. 하지만 피험자들이 동시에 있어야만 한다고. 정말? 시간에 따라 변하는 연결망을 생각하면 안되는건가?
여튼 이 '동기화 문제'를 해결하기 위해, 소수에게 사전게임을 시킨후 자세한 개인정보를 요구, 그리고 일정한 시간마다 게임할 때 사전공지. 이런 방식(?)으로 공공재게임 등을 실험했다고.
공공재게임: 참가자들이 자신이 가진 돈 중 일부를 기부하면 그 돈을 모아서 일정한 값을 곱한 후 모든 참가자에게 똑같은 금액으로 되돌려줌. 기부안하고 받기만 하면 가장 이익이 크지만, 모두가 이렇게 생각하면 아무도 기부안해서 받는 돈은 0
기존 실험실에서 사람들 모아서 한 연구결과와 AMT이용한 결과가 오차범위 안에서 같음. 이제 연결망을 고려: 모두 일정한 수의 이웃하고만 상호작용 하도록 함. 보수는 자신과 이웃들이 기부한 돈으로 결정. 즉 주변 사람들의 행동으로 조건화.
다양한 구조의 연결망에서 실험해보니 "우리에겐 놀랍게도" 연결망이 결과에 영향을 주지 않는 것으로 보임. 사람들이 조건적 협조자가 아니었거나, 재강화(reinforcement)가 먹히지 않았거나 행동의 전염이 일어나지 않았거나.
일부를 더미행위자로 넣은 후 같은 실험을 반복했다고 함. 여튼 언제 연결망이 중요하고 언제 그렇지 않은지 계속 연구할 필요가 있다고. AMT비용은 1인당1시간당 1달러 정도, 기존 10달러에 비해 싸고 참가자도 더 다양.
"사회과학2.0?" "망원경이 자연과학에 혁명적 변화를 가져왔듯이 인터넷이 사회과학에서 같은 역할을 할 수 있을까?" 우리는 스스로에 대해 잘 안다고 하지만 막상 뭔가 예측하려면 실패하는 경우가 많다고...
브라이언 우지의 "사회연결망에서 동시성과 집합적 천재" 발표 시작. 내년 넷싸이 조직위원장. 내년에는 미국 북서대에서 열릴 듯?
정보기관직원,주식거래자들 뿐 아니라 일반 사람들도 옛날에 비하면 많고 복잡한 정보에 노출되어 있다고. 주식거래자들 사이의 인스턴트메시지를 분석. 07년9월-09년2월, 66명, 1백만거래, 2백만메시지,5천종의 주식에 대해 봤다는겨?
거래자들과 주식들 사이의 이종연결망. 거래자들은 인스턴트메시지 교환하는 연결망. 거래자들의 시간에 따른 거래패턴을 보면 '동기화'가 타이밍의 정확성을 높여서 수익이 높아진다고. 대화를 주고받는 패턴이 거래패턴을 시간적으로 살짝 앞서감.
낮은변동성-약한링크, 위험경보단계-강한링크, 심각한변동에서는 약한/강한링크 혼합효과가 강하다고. 이거 재밌는 듯.
잠시 쉬고 야노쉬 켈테츠의 "정보통신에서 인간동역학" 발표. 정보통신기술의 발달로 대량의 통신정보를 바탕으로 거시-중시-미시 규모에서 사람들 사이의 상호작용을 연구할 수 있게 됨.
거시적 효과: 핸폰통화데이터에서 정보확산을 시늉내보면 공동체구조, 링크비중의 이질성에 의해 정보확산속도가 늦어지는 효과. 중시적 효과: 한 사건이 다른 사건에 주는 영향을 동역학적 모티프로 정의하여 연구. "행동방아쇠"...
미시적으로는 사건사이시간의 거듭제곱분포(=폭발성 burst)에 관한 연구 소개. 일간/주간패턴 빼도 폭발성 남음. 이것만으로는 부족하고 폭발구간(bursty period)을 정의하고 각 구간에 포함된 사건개수의 분포 역시 거듭제곱분포.
이 발표에서는 명시적으로 언급하지 않았지만 변형된 푸아송과정으로 폭발성을 설명하는데 분명한 한계가 있다는 것을 의미. 그리고 인간동역학에서 발견된 현상이 지진이나 생물현상에서도 관찰된다고.
관롱 첸의 "복잡연결망에서 스펙트럼과 동기가능성(synchronizability)" 발표. 연결망 위에서 선형으로 퍼지게(diffusively;;;) 상호작용하는 동역학계의 동기화를 라플라스행렬의 고유값을 분석하여 연구함.
리아푸노프 지수가 스펙트럼으로 나타나고 그 지수가 음수가 될때 동기화되는 것으로 보이는데 이 범위는 0보다 큰 최소고유값을 최대고유값으로 나눈 값의 크기에 따라 결정됨. 이 고유값 비율은 최대이웃수, 최소이웃수 등과 관계가 있음.
이웃수분포,사이중심성 등이 동일하지만 서로 다른 두 연결망을 만들면 이런 차이가 동기화에 영향 줄 것 같지 않지만 실제로 고유값이 달라지고 동기화에도 큰 영향을 미침. '생각보다' 연결구조에 민감하다는 얘기.
링크가 많아지면 동기화 잘되나?라는 문제. 링크가 많아지면 고유값은 커지는데 고유값 사이의 비율이 커질수도 줄어들수도 있음. 주어진 그래프의 보완그래프가 연결되어 있는지 아닌지에 따라 원래그래프의 고유값에 대한 성질이 달라짐.
좁은세상연결망의 경우 무작위도가 커질수록 고유값비율이 커져서 동기가능성도 높아짐. 등등. 이웃수 순열(d_i)과 고유값 순열(lambda_i) 사이의 관계: d_i-sqrt(d_i) <= lambda_i <= d_i+sqrt(d_i)
안풀린문제: 어떤 연결망이 주어졌을 때 링크를 옮기거나 더하거나 지움으로써 동기가능성을 높일 수 있는가?
점심 여유있게 먹고 오후첫 평행세션 마지막 발표 직전 들어옴. 드반은 비디오게임 개발자들의 공동작업으로 연결망을 만들어 역사적 분석을 함.
같은 장소에서 사회넷3 세션 진행중. 크링스는 범죄소설의 등장인물, 사건 사이의 연결관계를 구성하여 연결망을 분석.
메네제스의 발표: "미국의 장기이식(organ transplant)연결망"을 발표. 매일 18명이 장기가 없어서 죽는다고. 현재 대기환자 11만명. 2010년 약 3만건의 장기이식. 관련된 비영리기관 UNOS의 활동도 소개.
흑인이 백인보다 장기이식을 두배 오래 기다리고, 여성도 장기에 대한 접근성이 낮다고. UNOS데이터를 1987년부터 모은 걸 분석. 장기기증에 관한 정보를 이용하여 시각화하면 도움이 될것이라고. 기증자와 수혜자(?) 사이의 지역특성...
기증자의 지리분포와 수혜자의 지리분포가 거칠게 볼 때는 대동소이한데 좀더 자세하게 ZIP코드로 보니 장기가 어디서 어디로 움직이는지 드러난다고. 시골에서 기증된 장기가 도시지역에서 쓰이는 경향이 있다고. 기증자-수혜자 연결망도 만들어 분석
주(state)단위로 연결망 만들어서 공동체(community) 찾아보면 심장의 경우 서부,중부,동부로 나뉨. 창자는 더 얽힌 모양. ZIP으로 좀더 자세히 보면 당연히 좀 달라보임;; 장기기증연결망이 거듭제곱분포라고. 끝.
실비아로아나의 "로마니아의 입법활동의 연결망분석" 발표. 08년선거개혁 상황, 국회의원 사이의 협조활동 분석, 이전 결과와 비교. 가설1: 비례대표에서 혼합비례대표(?)로 가면 정당간협력이 더 나타날 거다. 가설2: 선거개혁 과정에서 의원간 협력증가할
의원이 노드, 입법제안자 목록에 같이 있으면 링크.인 듯. 06, 07, 09, 10년 각각에 대해 연결망 구성해서 보여주는데 육안으로 구별불가;; 결과: 06,07보다 이후에 링크밀도 증가. 가설1 결과는 놓침;;
팔의 발표: 학교연결망에서 관계공격성의 결정요인과 동역학. 부정적 관계는 보이거나(언어/물리적 공격성) 안보이거나(증오/싫어함). 부정적 연결망의 형성과 동역학을 연구. 오 신선하다.
가설1: 부정적관계의 서로다른 형태는 서로 다른 사회적환경(계급 등)에 주로 의존한다. 가설2: 사회적으로 균질한 교실에서 지위획득(status attainment맞나?)이 느릴수록 부정적관계의 우월한 형태는 보다 균일하다.
동부헝가리 작은 마을 3개학교의 10개학급에서 306명 학생 조사. 10가지 부정적관계에 대해 분석. 가정환경(?)에 따라 균질한 학급4개, 비균질학급 5개로 구분. 들어오는 이웃수분포가 거듭제곱이라고 말하는데 샘플이 적어서;;
비균질학급이 균질학급보다 개인차원에서 학생들이 더 사회적이라고 하는듯. 중요한 결론을 잘 못알아들어서-_-;;; 뭔가 가십(gossip)이 다른 요인보다 중요하게 작용한다고 하는 듯. 부정적관계니까 여기서 가십은 뒷다마인가;;
@LunamondGill 세분(?)하자면 경제학, 사회학, 물리학, 전산학 등 다양하고 요즘은 '연결망과학'으로 부르려고 하더군요. 오늘 저녁에 학회 마지막 행사로 Network Science Society 발족식이 열릴 예정입니다.
마지막발표!로 파라도프스키가 온라인사회연결망에서 언어확산에 대한 연구발표. 이런거보면 디씨인사이드 같은 커뮤니티싸이트 연구하면 재밌겠다는.
언어의 창조를 공동체/문화의 혁신능력으로 보겠다고 함. 폴란드(?) 마이크로블로그 데이터 다운받아서 분석하는 듯. 색다른(idiosyncratic) 태그의 숫자는 계속 증가. 사용자들의 창조성은 정규분포로 보임.슬라이드 너무 빨리 지나감;
문턱값과 인기도가 양의 상관관계를 보인다고. 여기서 문턱값이 새로운 낱말을 받아들이는 문턱값인가? 그러니까 가장 재미있는 결과라고 하겠지. 끝.
포스터세션이 있었던 곳에서 바라바시의 강연. 연결망 제어가 주제. 지난 스톡홀름 컨퍼런스에서 들은 내용이긴 함. 선형제어시스템에 관한 칼만의 순위조건(Kalman's rank condition)을 소개하고 있는데 칼만이 헝가리 수학자라고.
정말 마지막 행사로 연결망과학회(NSS) 조직구조, 필요한 인력, 뉴스레터, 펠로십 등에 관해 바라바시가 설명. 그외토론. 젊은연구자를 위한 논문출판에 관한 논의. 새저널이 필요하냐 아니냐. 각 분야저널에 내면 된다. 연결망이 독립분야는 아니라는 의견
그외 2주정도 연결망학교 같은걸 운영하자, 웹싸이트도 만들자, 학생들을 위한 교육... 그외 연결망자료공유 얘기였나?;;; 이제 정말 끝~!!!!