검색 엔진 HTML5를 선택하다

HTML5의 승리인가 아니면 시맨틱 웹의 승리인가.

구글, 야후 그리고 마이크로소프트가 2006년 웹 사이트맵 표준을 만들었던 것처럼 데이터 구조화 또는 시맨틱 데이터 표현을 위한 schema.org를 공동으로 개설했다.


시맨틱 표현(Semantic Annotation)은 마이크로포맷, RDFa 그리고 HTML5 Microdata 등 다양한 표준 경쟁이 있었는데, 결국 HTML5 마이크로데이터로 귀결되는 모양세다.

웹 사이트 운영자 입장에서는 시맨틱 표현을 하는 것은 조금이라도 더 잘 검색되기 위한 검색 엔진 최적화(SEO)에 목적이 있기 때문에 환영할만한 일이긴 하다. 세 가지 방법으로 모드 마크업에 한다는 건 비용이 소요되는 것이니... />


schema.org에 있는 것은 100여개의 데이터 표현을 포함하고 있고 이는 Yahoo!의 SearchMonkey와 Google의 Rich snippets를 합한 것을 중심으로 담고 있다. 웹 사이트들이 이들 속성 태그를 사용하면 검색 결과의 상위에 노출되고 특히, 더 많은 정보를 자세히 표현할 수 있다.



schema.org의 설명에는 이렇게 적혀있다 :
대부분의 웹 사이트가 데이터베이스에 저장하고 있는 구조화된 데이터로부터 웹 페이지를 생성하지만 그 데이터를 HTML에서 다시 얻기란 매우 힘듭니다. 웹 페이지를 분석하는 많은 웹 애플리케이션이나 검색 엔진은 원래 구조화된 데이터에 접근하여 웹 페이지의 정보를 이해하여 보다 풍부한 검색 결과를 제공할 수 있고 사용자는 적절한 정보를 쉽게 찾을 수 있습니다.
주요 데이터 표현은 다음과 같다.
전 세계에서 검색 엔진은 몇 개 없다. 구글, MS, 야후, 바이두(중국), 얀덱스(러시아) 정도... 국내에서는 네이버, 다음 어디서 먼저 도입할 것인가?

'시맨틱 웹' 카테고리의 다른 글

클라우드 기반 대용량 시맨틱 웹 검색  (1) 2010.03.26
Social Interaction Ontology  (0) 2009.06.11
구글은 시맨틱웹에 관심 없다?  (5) 2009.05.14