내용 |
Europeana는 지난 5월 메타데이터의 품질에 관한 보고서(Report and Recommendations from the Task Force on Metadata Quality)를 공개했다. 이는 2013년 12월에 설치된 메타데이터 품질에 관한 프로젝트팀의 결과물이다. Europeana는 유럽 내 3,000개 이상의 기관의 메타데이터가 축적되고 있는데 이러한 메타데이터의 품질에 관한 문제가 제기되고 있다. 본 보고서에서는 메타데이터의 품질에 가장 큰 영향을 미치는 7가지 요인을 정의하고 품질 개선을 위한 제언을 하고 있다. 본 보고서에서는 고품질 메타데이터를 7가지로 정의하고 있다. 1)신뢰할 수 있는 프로세스를 거쳐 생성된 것, 2)발견 가능성이 있는 것, 3)가독성이 있는 것, 4)표준화되어 있는 것, 5)이용자에게 유익한 것, 6)재이용에 문제가 없는 것, 7)가시성이 있는 것. 이러한 요인 중에서도 특히 1), 2), 5)에 대해 중점적으로 설명하고 있다. 1) 메타데이터가 생성된 이후 Europeana에 도착할 때까지 수많은 메타데이터 처리 프로세스를 거치지만, 어떠한 프로세스에서도 메타데이터 포맷 변환으로 인한 데이터 손실을 최소화하여야 하며 이 모든 프로세스가 신뢰할 수 있는 것이어야 한다고 말하고 있다. 프로세스의 신뢰성을 향상시키기 위해 수집기가 데이터 제공 기관과의 커뮤니케이션을 긴밀하게 유지하며 프로세스의 투명성을 향상시킬 것을 권하고 있으며, 데이터 추가와 같은 간단한 매핑 이외의 작업을 수행하지 않는 것도 필요하다고 말하고 있다. Europeana Data Model(EDM)의 이용자 관점에서의 개정의 필요성도 제언하고 있다. 또한 메타데이터 크로스워크에 대해서도 음성 등 각종 콘텐츠의 메타데이터를 EDM에 매핑할 때의 사례들과 문제점을 문서화하여 공유함으로써 신뢰성이 향상될 수 있다. 2) 발견 가능성을 향상시키는 것으로는 크로스워크에 의한 표준화된 매핑 관련 키워드의 사용, 타이틀 등 콘텐츠를 고유 식별할 수 있는 기술, 온라인 어휘인 URI등 고유 영구 식별자 부여, 계층 구조에 따라 컬렉션 내 콘텐츠의 위치를 명확히 하는 것 등을 들고 있다. 타이틀과 같은 필수 필드를 자세히 설명하고 링크드오픈데이터의 어휘를 사용하여 메타데이터를 기술할 것을 제언하고 있다. 3) 사람이 이해할 수 있도록 메타데이터를 자세히 설명하고 컬렉션 내 각 콘텐츠의 정확한 위치를 명시함으로써 이용자에게 더욱 의미있는 메타데이터가 될 수 있다고 말하고 있다. 등록된 메타데이터의 품질이 낮은 요인으로는 메타데이터 작성시에 향후 이용을 예상하지 않은 것, 메타데이터가 자료 보존 프로세스의 부산물로 간주하는 있는 점, 디지털화된 자료라고 해서 충분히 검증하지 않는 점, 재원의 제약, 미술자료 등 디지털화된 자료의 종류에 따라 메타데이터가 간단하게 작성된 점, 기술적인 문서의 이해 부족 등을 들고 있다. 이에 따른 프로젝트팀의 제안은 3가지 관점에서 정리하고 있다. 우선 동기 부여 측면에서 콘텐츠 정리, 메타데이터 처리 프로세스의 신뢰성, Europeana 수집팀과 데이터 제공기관과의 충분한 커뮤니케이션을 제언하고 있다. 다음으로 기술적인 면에서는 EDM관련 문서의 개정과 크로스워크의 명시, 링크드오픈데이터 어휘 사용, 관련 URI 기술을 말하고 있으며 마지막으로 각 기관의 관계 측면에서 메타데이터 처리 프로세스의 투명성, 데이터 작성 기관 및 수집기의 메타데이터 확인을 각각 제언하였다. |