*소셜 웹

소셜 친구 추천의 한계 (3)

대개 소셜 네트웍 분석 및 연구자들에게 킬러 애플리케이션을 묻는다면, 친구 추천(Friend Recommendation)을 많이 꼽는다. 사람들에게 친구 추천이 유용한 기능이라고 생각하기 보다는 추천 알고리즘을 검증하는 데 용이한 측면이 있기 때문이다. 아니나다를까 우리가 쓰는 소셜 네트웍 서비스에서도 친구 추천은 가장 먼저 구현되고 제공되는 기능이기도 하다. 트위터도 "팔로우해야할 사람", 페이스북도 "알 수도 있는 사람", 심지어 싸이월드도 "오래된 친구 추천" 기능이 들어 있다. 친구 추천은 각 서비스의 특징에 따라 달리 해야 되겠지만 대개 1) 상호 관계- 일방향 혹은 양방향 연결 2) 공통된 관심사 - 사는 지역, 성별, 연령대와 공유하는 정보의 의미 3) 공유 인맥 - 친구의 친구 등으로 연결..
2010.09.13

소셜 웹 알고리즘 만들기 (2)

전세계 최대 소셜 네트워크 서비스라할 수 있는 페이스북의 개발자 컨퍼런스(f8)이 있었다. 뉴스에 오르내리지는 않았지만, 페이스북 로그인 후 첫화면에 나오는 친구들의 최근 소식을 요약해서 전달해 주는 알고리즘인 EdgeRank에 대한 내용이 있었다. 친구들의 모든 활동을 다 보여줄 수 없기 때문에 가장 중요하고 볼 만하다고 여겨지는 것만을 선별하는 알고리즘이다. PageRank에 이후에 수 많은 Rank들이 나와서 이름이 낯설지는 않지만 Edge라는 건 특정 기사(Object)에 어떤 상호 작용(Status)이 추가 될 때 새로운 것이 덧붙여지기 때문에 붙인 이름 같다. 아이디어는 아주 간단해서 (1)affinity score: 새로운 소식을 업데이트 한 사람과의 친밀도 (2) weight: 각 상호작용..
2010.04.24

과학자를 위한 소셜 서비스

과학을 연구하는 사람에게 소셜 네트웍 서비스는 일종의 시간 낭비와 같은 것이다. (물론 예외도 있지만) 그 시간에 랩에 틀여 박혀서 논문 하나 더 읽는 게 중요하다고 생각하는 사람들이 많다. 그러나 사실상 연구도 협업의 시대에 들어선 요즘 이제 과학자들을 위한 소셜 네트웍이 중요해졌고 이에 대응하는 여러 서비스가 있다. 이제는 이러한 변화를 외면할 수가 없다는 말... 최근 좀 알려지기 시작한 연구자를 위한 온라인 소셜 네트웍 서비스들을 한번 알아보자. 아카데미아(Academia.edu) 영국 벤처 기업인 Academia.edu는 소셜 네트웍망을 제공하는 서비스이다. 마치 Geni.com과 같은 가계도와 유사하다. 교수, 박사 졸업자, 대학 졸업자, 지도 교수 및 멘토, 동료 등과 같은 관계망에서 연구 ..
2010.02.18

소셜 검색 알고리듬 찾기 (3)

웹 검색에 있어 PageRank가 가져온 영향력을 볼 때, 소셜 데이터가 실시간으로 전달되는 현 시대의 검색 패러다임에 걸맞는 알고리듬이 필요한 시점이 되었다. 1998년에 Larry Page와 Sergey Brin이 발표한 "Anatomy of a Large-Scale Hypertextual Search Engine"라는 논문을 빗댄 "Anatomy of a Large-Scale Social Search Engine"라는 논문을 블로그에 공개했다. 이 논문은 페이지랭크 논문이 WWW1998에서 발표된 것 처럼 오는 4월 WWW2010에서 발표된다. 이 논문의 저자들은 Q&A 기반 소셜 검색 엔진 개발 회사은 Aardvark의 개발자들로서 구글에 근무하던 직원들이 2008년에 만든 회사다. Aardvar..
2010.02.12

HITS 알고리듬과 소셜 네트웍 (1)

웹 기반 정보 검색(Information Retrieval)에서 웹 문서간 하이퍼링크를 통해 좋은 문서를 찾는 랭킹 모델의 가장 중요한 알고리듬이 두 가지가 있다. 하나는 HITS(Hyperlink-Induced Topic Search)이고 나머지 하나는 페이지랭크(PageRank)이다. 두 가지 모두 너무 유명해서 설명할 것도 없지만 간단하게 정리해 보면 다음과 같다. HITS는 웹 문서을 서로 링크로 인용하는 행렬로 보고 그 고유벡터(eigenvector)를 계산하는 방식을 기반으로 만들어졌다. 이 알고리듬은 크게 두 단계로 나뉘는데 질의어와 관계있는 문서의 부분집합(서브 그래프(subgraph))을 만든다. 그리고, 서브 그래프를 이용해서 Hub와 Authority를 계산하는 단계이다. 그림에서 보..
2009.05.08