*검색엔진

Linked Data 기반 검색 현황과 과제 - KSWC 2010

지난 12월 3일 국립중앙도서관에서 한국 시맨틱웹 컨퍼런스 (KSWC 2010) 가 열렸다. 이 행사는 국내 시맨틱웹 연구자들이 모여서 시맨틱웹에 대한 소개와 최근 동향에 대해 공유하는 행사이다. 올해는 공공정보의 활용 가능성을 주제로 하고 있고, 특히 링크드데이터(LinkedData)에 대한 세부적인 세션들로 마련 되었다. 지난 클라우드 기반 시맨틱웹 검색 엔진 개발 사례를 기반으로 대용량 링크드 데이터를 이용하기 위한 방법 및 문제점에 대한 발표를 하게 되었다. 강연 내용 요약은 다음과 같다. LinkedData는 기존의 의료, 문헌 도메인을 벗어나 콘텐츠, 정부 데이터 등 그 폭이 커질 뿐만 아니라 데이터량도 폭발적으로 증가하고 있다. 일반적으로 특정 도메인의 시맨틱 웹 데이터 검색 서비스를 제공하..
2010.12.06

클라우드 기반 시맨틱 웹 검색 개발 사례 - 플랫폼데이 2010

지난 10월 26일 플랫폼데이 2010에서 '클라우드 기반의 시맨틱 웹 검색 서비스 개발 사례'에 대한 발표를 하게 되었다. '플랫폼데이'는 2007년 KAIST, 2008년 서울대, 2009년 이화여대에 이어 올해 건국대에서 4회째 개최되는데, 최근 주목받고 있는 클라우드 컴퓨팅 플랫폼과 대용량 데이터 처리 플랫폼, 대규모 분산 시스템 플랫폼을 주요 주제로 하고 있다. 우리 연구실에서 진행한 클라우드 컴퓨팅 기반의 시맨틱 웹 데이터 처리는 Hadoop 응용 및 NoSQL 기반 분산 데이터 저장소 적용사례 중 하나이다. 클라우드 기반의 시맨틱 웹 검색 서비스 사례 (플랫폼데이 2010) from Channy Yun 시맨틱 웹 데이터를 검색으로 제공키 위해, 기준의 방법론을 탈피하여 클라우드 컴퓨팅 환경에..
2010.10.28

클라우드 기반 대용량 시맨틱 웹 검색 1

작년에 이어 올해 학교에서 과제 PM으로 맡고 있는 분야가 있다. 바로 대용량 시맨틱 웹 검색 엔진을 연구하고 만들어 보는 일이다. LinkedData가 활발해지면서 시맨틱 웹 포맷을 가진 데이터양이 기하 급수적으로 늘고 있고 이들 데이터를 크롤링 해서 적합한 쿼리에 대한 응답을 만들어 주는 검색 엔진에 대한 연구가 필수 불가결한 상태가 되고 있다. 문제는 기존의 시맨틱 웹 검색 엔진들이 특정 도메인의 적인 데이터를 다루다보니 기존 DB 방식의 검색 이상을 해보지 않았고, IR의 기법을 가져오자니 시맨틱 웹의 원래 의도를 반영하기가 어려운 단점이 존재하고 있다. 정보 검색에 대한 두 가지 접근이나 시맨틱 검색 vs. 시맨틱 웹 검색에서 이런 종류의 이야기를 한 적은 있지만 우리가 가진 접근 방법에 대한 ..
2010.03.26

healthBase, 아직 요원한 의료 검색 서비스

헬스 케어 웹 서비스 같은 의료적 질문을 해결하는 사이트가 점점 늘어나고 있어서 어떤 사이트가 더 좋은지 말하기 어려운 상태가 되고 있다. 이런 와중에 NetBase Solutions가 healthBase라고 하는 웹 사이트를 시작했다. 이 사이트는 WebMD, Wikipedia, PubMed 및 Mayo Clinic 등 의학 정보 사이트의 신뢰할 수 있는 정보를 집약해서 시맨틱 검색을 할 수 있다고 한다. healthBase는 NetBase가 독자적으로 개발 한 검색 기술을 이용하고 있다. 이는 문서 내 문장을 해석해서 언어학적으로 컨텐츠를 분석함으로서 건강상 문제나 병에 대한 치료법과 각각의 처치법, 의약품 사용 방법, 식단 조절 같은 부분에 추천과 장단점을 제시해 준다. 우선 검색 결과는 매우 인상..
2009.09.08