willtosee

A taxonomy of common link mining tasks

In Network Analysis on September 4, 2009 at 1:12 am

When I was developing NetMiner 3 – the SNA(social network analysis) software – in Cyram(c), one of the challenge I confronted was to effectively classify about 100 SNA methods/techniques so that user can intuitively find one he/she is looking for. There was no standard way to do this – every program differs in its way of organizing its menu. While reviewing the paper ‘Link Mining: A Survey(Lise Getoor and Christopher P. Diehl), I’ve found their interesting viewpoint: they suggests the following taxonomy of link mining tasks.

1. Object-Related Tasks

  • Link-Based Object Ranking
  • Link-Based Object Classification
  • Object Clustering (Group Detection)
  • Object Identification (Entity Resolution)

2. Link-Related Tasks

  • Link Prediction

3. Graph-Related Tasks

  • Subgraph Discovery
  • Graph Classification
  • Generative Models for Graphs

One can easily match each function in NetMiner/Pajek/UCInet to one of those categories.

다시, 여는 글

In Diary on September 1, 2009 at 5:16 am

지난 ‘여는 글’로부터 반 년 즈음이 지났다. 블로그를 완전히 방치해 두고는 있었지만, 가끔의 심심풀이로 접속할 때마다 그 글을 다시 읽으며 나는 어떤 감회에 빠져들곤 했다. 잘 쓰여진 글이어서가 아니라, 당시의 자신이 얼마나 학문적 성취에 목말라하고 있었는지, 아니면 적어도 그렇다는 환상을 갖고 있었는지를 떠올리게 해주기 때문이다.

나는 좋은 회사에서 멋진 사람들과 흥미로운 일들을 하며 3년을 보낼 수 있는 행운을 얻었지만, 그럼에도 불구하고 스스로를 관리하는 역량이 부족하여 미처 긴 호흡으로 생각하고 공부하는 여유를 내지 못했다. 게다가 POSTECH에 산업경영공학과 학생이라는 적(跡)을 아직 남겨두고 있던 나로서는, 학교로 돌아가기만 하면 그동안 막혀 있던 지적 성취에 대한 욕구가 봇물처럼 터져 나오며 그간 궁금해 오던 것들을 삽시간에 섭렵해 버리지 않겠는가 하는 현실도피적 망상을 하고 있었던 것이다.

그래서 그 다음 이야기는 어떠했을까? 나는 앞서의 ‘여는 글’을 읽을 때마다 그 글의 여운이 암시하는 바와 현재 자신의 모습을 비교해 보며 재밌어하곤 했다. 당연하지만 이상과 같을 순 없었다 – 나태하고 무능한 것이 학교로 돌아간다고 고쳐질 리가 있으랴. 언제까지나와 마찬가지로 방종한 시간들을 보냈다. 허나 실변수함수론(Real Analysis)이나 수리통계학(Mathematical Statistics)와 같이 수년간 별러만 왔던 공부들이 사전에 충분한 준비를 갖추지 않은 나의 게으름을 호되게 벌하는 와중에서도 그만큼 단기간에 많은 성취를 이룰 수 있게 해 주었고, 나는 그간의 공백이 학문적 성취에 대한 희망을 잃을 정도는 아니라는 자신감을 얻었다.

그리고 그 연장선상에서, 지금 나는 너무 감사한 기회를 얻어 Purdue University에 와 있다. 가을 바람에 기분이 싱숭생숭 해지며 벌써 고국에 있는 친구들 얼굴이 하나 둘씩 떠오르는 오늘, 여는 글을 다시 한 번 써 보며 내 자신의 행보가 그리고 있는 궤적을 뒤돌아 본다.

알지 못하면서 안다고 말하는 것, 그리고 모르는 것을 부끄러워하지 않는 것은 얼마나 고통스러운 시간들이었는가? 내가 통계학 공부를 하고자 한 것은 그닥 금전적 도움도 되지 못하는 박사 졸업장 쪼가리를 위해서가 아니라, 정확히 알고 정확히 말하는 사람이 되고자 하기 위함이었다. 그렇기 위해 5년이 얼마나 짧은 시간인지는 뼈저리게 느끼고 있다. 한 학기에 정말 무리하게 많이 수강해 보아야 고작 네 과목 정도, 그리고 작은 세부 분야의 연구에 조금의 기여라도 하기 위해 노력하는 것 – 물론 가치 있는 일들이지만, 이것만으로 내 목표를 얼마나 성취할 수 있겠는가?

정말 많이 읽고 많이 생각하고 많이 말하겠다. 정말로 그리할 것이다.

여는 글

In Diary on December 15, 2008 at 1:19 am
12월 20일 ‘사이람 토요 세미나’를 마지막 업무로 (주)사이람을 퇴사했다. 첫 출근이 2006년 2월 1일이었으니, 총 34개월간 근무한 것이다. 막 junior 티를 벗고 슬슬 senior가 되어가는 시기였던 셈이다. 많은 직장인들이 이 정도 타이밍에 다음 단계의 커리어를 생각하는데, 의도한 것은 아니지만 제법 꼴이 비슷하게 되었다.
사이람에서의 업무의 성격, 질, 강도에 대해 심각한 불만이 있었던 것은 아니지만, 피고용자로서의 스트레스로부터 완전히 자유로울 수는 없었기에 늘 한 일주일 정도는 나태를 즐겨보고 싶다는 소망을 가져왔다.  하지만 막상 기회가 주어지자 부리나케 포항으로 내려오고 말았다. 휴식에 대한 갈망보다 몇배 더, 지적인 자극과 학문적 성취에 굶주려왔기 때문이다.