티스토리 툴바


1월 15일

사랑하는 곳 2012/01/15 10:34
#1.

오랫만에 올리는, 시골 집 개 사진.
"아이구 좋아라"


#2.
휴일이지만, 회의가 있어서 병원에 나왔다.
지나가고 있는 주간에는, 하루만 제외하고 계속 '저녁 일정' 혹은 '큰 일'이 있었다. 공보의 3년 + 전임의 1년 해서, 이제 혼자서 할 수 있는 일이라면 어떤 것이든지 충분한 내공이 쌓였다고 생각했는데. 하지만 그런 '큰 일'이 연이어 발생하다 보니, 내공이 무너지는 굉음이 연이어 들리곤 하였다. 그냥 하루 날 잡고 밤새 일을 하는 것도 좋은 방법이었겠지만, 그건 '지속 가능한 업무 행태'가 아니었을 것이다. 이제 삼십 대의 허리가 꺾이는 나이가 되고 보니, 주말에 쉬지 못하면 그 다음 주가 고생스러운 몸뚱아리가 된 것. 그렇게 나이를 먹고 있다. 배는 부르지 않지만.


#3.
이제는 사실, 혼자서 하는 일보다 다른 사람과 같이 일을 하고, 다른 사람에게 일을 분배하고 조직하며, 다른 사람이 만들어 낸 결과물을 보완하고 수정하는 일에 익숙해져야 하는 시점이 된 것 같다.


#4.
나름 중요한 사회적 의미를 갖고 있다고 생각되는 논문을 하나 썼는데, 그럭저럭 modest한 정도의 저널에서도 떨어지고 있다. 언제 시간이 나면, 그 동안 출판했던 논문의 숫자 대 투고했던 저널의 숫자를 계산해 보는 것도 재미있겠다. 물론 IF 낮은 저널에 붙었던 논문은 투고 저널의 숫자가 높은 게 당연하겠지만 말이다. 쩝.

방법론 측면에서 상당한 약점을 갖고 있지만 그럭저럭 '사회적 의미'가 강점이라고 생각했던 이 논문은, 결국 '방법론'이라는 요소 때문에 리뷰어에게 좋은 인상을 주지 못하는 것 같다. 그 동안 여러 차례 다른 사람들의 논문을 리뷰했었고, 한두 번을 제외하고는 나 역시 reject를 때리는 harsh reviewer이긴 했지만, 리뷰를 할 때에 '알게 모르게' 중요하게 작용하는 요소가 바로 저자의 '이름 값'인 듯 하다. 저자 중에, 해당 분야를 계속 연구하고 논문을 썼던 사람이 있으면, 특히 임상 시험까지 수행하는 사람이 있으면, 아무래도 마음 속으로 점수를 더 주게 마련인데.
리뷰의 decision 그리고 reviewer's comment는 결코 공정한 것이 아닐 게다.

그런 의미에서, social network가 중요한 세상이다.

저 논문은 다음에 또 어디로 가나.... 
저작자 표시 비영리 변경 금지
크리에이티브 커먼즈 라이선스
Creative Commons License
Posted by 팬다 돌돌2

1월 10일

사랑하는 곳 2012/01/10 12:32
#1.

12월 3일. 동대구역 앞에서.


#2.
1월과 2월 두 달 동안 강도 높은 체중 감량을 하기로 마음먹었다. 체중 감량은 결과적으로 열량 섭취와 열량 소비 사이의 균형을 negative balance 쪽으로 이동시키고, 이를 체내 저장 열량을 소모시킬 정도로 장기간 유지해야 가능할 것이다. 공중보건의 때 약 2년간 노력하여 상당한 체중 감량을 이룩했지만, 수천 년 이상 수렵 생활과 불규칙한 식량 공급에 익숙해져 있던 이 육체는 곧 넉넉한 열량 저장소를 몸 여기 저기에 만들어 버렸다. 1월이 되자마자 바로 식사량 제한 및 탄수화물 제한을 시작했다. 그렇지만 운동을 예전만큼 할 수 없는 상황에서, 식사량 제한 초기의 급격한 감소 이후 이어지는 정체기가 매우 빠르게 와 버렸다. 

어쨌든, 식사량을 제한하는 생활 습관에 몇 가지 장점은 있다. 오후 나절에도 일을 할 수 있다는 것과, 각종 카페인의 효과가 더욱 향상되어 나타난다는 것. 그 덕에 1월 이후에는 계속 어딘지 high인 상태를 유지하고 있는데. 적어도 이 신경흥분물질의 과잉 상태를 1월 말-2월 초까지는 끌고 가야 하겠다. 


#3.
처음 나꼼수가 사람을 입에 오르내리던 무렵 몇 번 들었다가, 하도 시끄러워서 중단했었다. 그러다 선관이 디도스 공격 무렵에 다시 듣게 되었고, 그러면서 1회부터 다시 정주행 중이다.
나꼼수는 어쨌든 장단점과 호오가 분명한 포맷과 컨텐츠를 갖고 있다. 이러한 형태와 내용은 결코 즉흥적인 것이 아니고, 신중하게 계산된 것이라고 생각되고 그렇기에 더 강력한 영향을 주는 듯 하다. 어떤 사람들은 인신 공격 및 허위 사실 유포의 선을 교묘하게 넘나드는 그 내용을 비판하기도 하고, 개인의 음모론으로 환원하는 정치 의식 결여를 비판하기도 하지만. 그건 듣는 사람이 적절하게 판단할 문제이겠다. 
사실 나꼼수를 들으면서 한 가지 배웠는데. 그건 정치적 지형 및 이념 그리고 시대적 지향 등등의 거시적인 틀은, 합리적이고 이성적인 개인의 미시적 움직임을 설명하는 데 적합하지 않다는 것이다. 거시적은 틀은 개인이 움직일 수 있는 3차원의 범위를 한정할 수는 있겠지만, 그 범위 안에서 개인이 보이는 궤적은 자신의 사상과 목적 및 가치관에 따라 간다는 점이다. 그리고 목적 의식이 명확하고 가치관이 뚜렷한 사람이라면, 자신의 목표까지 가기 위하여 가장 합리적이고 이성적인 방법을 동원한다는 추론이다. 나꼼수가 이야기하고 있는, 개인에 대한 음모론에 가까운 환원론적 설명이 어디까지 사실인지 그것은 알 수 없지만 (특정 지점에서는 잘못된 사실에 근거하고 있기도 하다), 그러한 방법론은 사회적인 관계 및 정치적인 지형 속에서 한 사람 한 사람을 해석하고 예측하는 데 유효하리라는 결론이다.

인간 관계를 소설 속 등장 인물을 통해서만 배우다 보니, 나이 서른 다섯이 되어도 여전히 인간 관계를 배우고 있다. 도...키의 소설에는 결코 '합리적이고 이성적인 인물'이 등장하지 않아서, 그런 부분 배울 수가 없었다.


#4.
하고 싶은 말은 많은데, 구글 엔진의 크롤링이 무서운 세상이다. 


#5.
카라얀이 지휘하는, 리하르트 슈트라우스 Sinfonia domestica를 듣고 있다.

슈트라우스 특유의 그 소리... ^^ 가 들린다. 






저작자 표시 비영리 변경 금지
크리에이티브 커먼즈 라이선스
Creative Commons License
Posted by 팬다 돌돌2

수식, 수식의 전개, 예시를 활용한 설명 등등을 모두 뭉뚱그려 요약하자면,

Multilevel model을 이용한 parameter estimation은 complete-pooling model과 no-pooling model 사이의 weighted mean이라고 할 수 있다.

(일단, linear model에서는 그렇게 이해할 수 있겠다. 다른 distribution model에서는 어떻게 설명되는지, 나중에 보도록 하자.)

10개 병원에서 뇌졸중 환자를 모았을 때,
complete-pooling은 '모두 동일한 환자'로 간주하고 한꺼번에 단일한 regression을 돌리는 것.
no-pooling model이 다소 애매한데, 이 chapter의 전반부와 후반부에서 서로 다르게 설명된다. 전반부에서는 각 group 별로 별도의 model을 만드는 것으로 설명되는데, 후반부에서는 separate model과 구분하여 single classical regression이지만 group indicator는 포함하되 group coefficient에 대한 model은 없는 것으로 설명한다. 각 group별로 별도의 model을 만드는 것을 separate model로 설명한다. 
(저자의 오류라기보다, 아마도 설명과 개념의 복잡도 증가에 따라 차근 차근 제시하는 것으로 생각된다.)

어쨌든.
그래서 multilevel linear model은 weighted mean이라는 게 이 chapter의 핵심이 되시겠다.
==> 여기에서 각 group 별로 계산되어 나오는 parameter estimate의 해석이 가능해지고, between-group variation (variance ratio)가 각 group에 있어 중요한 의미를 갖게 된다.
==> 그리고 group-level parameter 역시 자체의 mean (group-level에서는 complete pooling이라는 것이 존재할 수 없으므로)과 no-pooling estimate 사이의 weighted mean이라는 것이 자명하게 도출된다.

...

이러한 수학적 배경의 수학적 이해 및 계산/프로그래밍은 은 통계 전문가에게 의뢰하여 해결하도록 하고,

통계 이용자의 입장에서는, multilevel을 써야할 때 그리고 multilevel이 더 효과적인 때를 인식하는 것으로 충분하겠다.
그런데 아직까지는 이 책에서 명확한 rule of thumb을 보여 주지 않고 있다. (저자의 성향 상, 언젠가는 제시가 될 것으로 기대하고 있다.)

Multilevel은 between-group variation을 감안할 수 있기 때문에 더 좋다느니, group 내부의 sample size가 크거나 작거나 상관 없이 (적절하게 complete-pooling과 no-pooling을 오갈 수 있다) 계산 가능하다는 말도 있다.

Group의 갯수에 대해서도, 아직은 애매하게 서술하고 있다. 너무 작으면 between-group variation을 충분한 신뢰도를 갖고 추정할 수 없다. (2개의 관찰값을 가지고 true value를 예측할 수 없는 것과 동일한 상황) 그러나 극단적으로 말해서 하나의 group만 가지고도 multilevel을 돌릴 수 있고, 이 때 multilevel은 향후 '새로운 group'의 값을 예측하는 데 유용하다는 언급도 하고 있다.

각 group당 포함된 observation의 갯수는 얼마 이상이 되어야 하나? 상관이 없다고 한다. 각 group 당 2개의 observation만 있어도 충분히 model을 만들 수 있고, 또 상당 수의 group에서 하나의 observation만 있어도, parameter estimation은 가능하다고 한다.


...

Ch. 13은 나중에 먹고 사는 데 필요하면 읽어 보도록 하겠다.
여기에는 language보다 formula가 더 많다.
 
저작자 표시 비영리 변경 금지
크리에이티브 커먼즈 라이선스
Creative Commons License
Posted by 팬다 돌돌2