시맨틱 웹
검색 엔진 HTML5를 선택하다
HTML5의 승리인가 아니면 시맨틱 웹의 승리인가. 구글, 야후 그리고 마이크로소프트가 2006년 웹 사이트맵 표준을 만들었던 것처럼 데이터 구조화 또는 시맨틱 데이터 표현을 위한 schema.org를 공동으로 개설했다. 시맨틱 표현(Semantic Annotation)은 마이크로포맷, RDFa 그리고 HTML5 Microdata 등 다양한 표준 경쟁이 있었는데, 결국 HTML5 마이크로데이터로 귀결되는 모양세다. 웹 사이트 운영자 입장에서는 시맨틱 표현을 하는 것은 조금이라도 더 잘 검색되기 위한 검색 엔진 최적화(SEO)에 목적이 있기 때문에 환영할만한 일이긴 하다. 세 가지 방법으로 모드 마크업에 한다는 건 비용이 소요되는 것이니... /> schema.org에 있는 것은 100여개의 데이터 표현을..2011.06.03
클라우드 기반 대용량 시맨틱 웹 검색 1
작년에 이어 올해 학교에서 과제 PM으로 맡고 있는 분야가 있다. 바로 대용량 시맨틱 웹 검색 엔진을 연구하고 만들어 보는 일이다. LinkedData가 활발해지면서 시맨틱 웹 포맷을 가진 데이터양이 기하 급수적으로 늘고 있고 이들 데이터를 크롤링 해서 적합한 쿼리에 대한 응답을 만들어 주는 검색 엔진에 대한 연구가 필수 불가결한 상태가 되고 있다. 문제는 기존의 시맨틱 웹 검색 엔진들이 특정 도메인의 적인 데이터를 다루다보니 기존 DB 방식의 검색 이상을 해보지 않았고, IR의 기법을 가져오자니 시맨틱 웹의 원래 의도를 반영하기가 어려운 단점이 존재하고 있다. 정보 검색에 대한 두 가지 접근이나 시맨틱 검색 vs. 시맨틱 웹 검색에서 이런 종류의 이야기를 한 적은 있지만 우리가 가진 접근 방법에 대한 ..2010.03.26
Social Interaction Ontology
최근 소셜 시맨틱웹(Social Semantic Web)이라는 부분의 연구나 표준화가 활발하게 이루어지고 있다. 소셜 시맨틱웹이란 소셜 네트웍에서 사람과 사람 혹은 사람과 정보 사이의 관계를 의미 있게 표현하고 이를 통해 새로운 지식과 특정 문제를 해결하기 위한 시도이다. 특히 사람들의 협업과 상호 작용으로 생성된 웹 데이터를 좀 더 의미적으로 묶어 내기 위한 많은 시도들이 여기에 포함 된다. 예를 들어, 위키퍼디아를 조직화된 데이터로 뽑아낸 DBPedia로 부터 시작된 Linked Data와 온라인 커뮤니티에서 사람과 객체(글, 사진, 동영상)을 기술한 SIOC 그리고 소셜 검색 등 다양한 측면에서 연구가 되고 있다. 하지만, 나의 관심은 협업과 상호 작용으로 생산된 데이터를 연결하는데 있어 누가 누구..2009.06.11
구글은 시맨틱웹에 관심 없다? 5
구글이 Searchology 09라는 행사를 통해 자기들의 새로운 검색 서비스들을 선 보였다. 그 중에 Rich Snippets이라는 기능을 위해 시맨틱 웹 분야에 있는 사람이라면 어제의 뉴스는 “ RDFa와 Microformat 지원“이 알려졌다. Rich Snippets라는 이들 포맷이 지원하는 리뷰 결과 등 의미있는 데이터를 분석해서 검색 결과에 약간 멋있게 보여 준다는 것이다. 예를 들어 아래와 같은 검색 결과를 만들기 위해... Microformat의 hreview를 이용한다던가... RDFa의 용어 중 review type을 쓰는 식이다. 이 소식이 나오고 나서 많은 시맨틱 웹 관련 연구자나 기업, 관심자들이 이제 구글이 시맨틱 웹을 지원하는 것인가? 하는 논의가 시작되었다. 물론 구글은 이들..2009.05.14