생물정보 LOD 소개

생물정보 LOD(Linked Open Data)는 미래창조과학과부와 한국정보화진흥원의 지원을 받아 국립수목원과 국립중앙과학관이 보유한 생물정보를
LOD(Linked Open Data)기반으로 구축하여 서비스하고 있습니다.

국립중앙과학관의 국가자연사연구종합정보시스템에 국립수목원의 국가생물종 지식정보시스템 분산된 생물정보를 통합하여 단일화된 창구를 통해 사용자에게 제공하는 서비스입니다.
“생물정보 LOD”는 각 생물종에 대한 기본적인 정보를 포함하여 생물종의 특성, 그리고 생물종들 사이의 관계와 지리적 정보, 역사, 문화, 음식 등 다양한 도메인과의 관계 정보를 구축하여 서비스하고 있습니다.
이러한 서비스를 이용함으로써 사용자는 ‘노랑부리백로’라는 정보로부터 출발하여 ‘백로속’에 속하는 척추동물이 주로 ‘붕어’를 먹이로 먹고 있으며, ‘붕어’가 ‘하천’에 서식하기 때문에
‘노랑부리백로’가 ‘하천’에 서식한다는 연관데이터를 추출할 수 있습니다.
“생물정보 LOD”를 서비스하기 위한 데이터 서비스와 이를 활용하여 구축된 응용서비스를 구축하여 운영하고 있습니다.
2013년 사업에서 식물, 균류, 척추동물 3가지 분류 군에 대한 정보를 LOD로 구축하였고, 2014년 거미, 곤충, 지의류 등의 분류 군을 추가 구축하여 서비스하고 있습니다.

생물정보 LOD 구축 절차

  • 원시 자료 수집 및 분석
    LOD 구축의 대상이 되는 원시 데이터 목록 수집 및 LOD 구축 범위 확정
    원시 데이터의 데이터베이스 스키마 분석
  • 관련 사례 조사 및 분석
    국외의 관련 LOD 구축 사례 조사
    LOD 구축 사례에 대한 온톨로지 스키마 분석
  • 개념 용어 도출
    온톨로지의 Vocabulary로 활용될 수 있는 용어 도출 및 목적에 따른 분류
  • 생물정보 온톨로지 설계
    클래스 및 속성과 제약 관계 설계
    온톨로지 스키마 구축
  • 데이터베이스 변화 규칙 설계
    원시 데이터를 활용하여 구축할 수 있는 인스턴스에 대한 변환 규칙 설계
  • 생물정보 인스턴스 구축
    변환도구를 활용하여 원시 데이터의 변화
    추가 구축 대상 및 해당 정보에 대한 인스턴스 구축
  • 인터링킹
    외부 LOD와의 인터링킹(owl:sameAs, rdfs:seeAlso 등) 연계
  • 명세화
    온톨로지에 대한 명세서 작성
  • 링크드 오픈 데이터 발행
    구축된 생물정보를 웹에서 접근 가능하도록 발행 서비스 구축
  • 응용 서비스 개발
    웹을 통해 질의를 수행할 수 있는 SPARQL Endpoint 개발
    관계 탐색 및 패싯 검색(faceted search) 등 사용자를 위한 관련 응용 서비스 개발
  • 생물정보 LOD 활용 사례
    서비스 개발
    구축된 생물정보 LOD를 활용한 시범 웹 사이트 구축

생물정보 LOD 연계 개념도

관련 지식
  • 국립수목원
  • 국립중앙과학관
  • DBpedia
  • Geonames
  • Wildlife
  • WIKIPEDIA
  • KDATA
타분야 국가 DB
  • 역사정보
  • 천연기념물
  • 의약품
  • 식품
  • 문화
  • 생물종
    • 보호상태
    • 분류체계
      • 식물
      • 균류
      • 척추동물
    • 형태적 특징
      • 모양
      • 크기
    • 생태적 특징
      • 서식지
      • 번식

기대효과

  1. 1일반인을 위한 맞춤형 생물자원정보 제공 및 사용자 중심의 정보제공으로 생물자원 정보 공급의 확대 및 생물자원 정보의 활용성 강화
  2. 2국가 생물정보의 LOD기반 연계·통합 표준화 및 온톨로지 모델링을 통한 관리체계의 일원화 및 대국민 활용이 높은 생물정보의 지속적인 생산 효율성 강화
  3. 3차세대 멀티미디어 교육환경의 조성 및 고품질의 생물 관련 교육 및 학습에 활용
  4. 42015년 도입 예정인 태블릿 PC 기반의 전자교과서와 연계하여 교육현장에서 활용
  5. 5타 국가DB사업 분야 및 민간과의 양적, 질적 발전 가능한 기술 인프라 구축
  6. 6정보의 생산과 소비, 활용 패러다임이 기존의 정보생산자 위주의 단순하고 주도적인 정보 제공서비스에서 공동 생산, 공동 이용을 통해 양방향으로 선순환되는 구조로 전환되고 있어,
    이를 지원할 수 있는 지식생태계의 선순환 체계를 지원하는 기술적 인프라로 활용
  7. 7정보의 지능형 지식 정보제공 체계 수립을 통해 정보간의 연관관계를 구축하고 의미적 추론이 가능하게 함으로써 이용자에게 획기적이고, 지능화된 정보서비스를 제공