내용 |
2016년 D-Lib Magazine에 실린 Karen Smith-Yoshimura의 논문' Analysis of International Linked Data Survey for Implementers '으로 링크드 데이터를 구축하였거나 구축 중인 연구소나 기관의 담당자를 대상으로 2014년과 2015년에 OCLC Research가 실시한 설문을 비교 분석한 것이다. 최근 링크드 데이터 구축 프로젝트의 현황에 대한 조사 결과와 함께 구현된 링크드 데이터의 성격과 이유, 구축 시 도출된 어려움 등에 대한 조사 결과도 분석하였다. 링크드 데이터 정보원의 장점을 부각시킬 수 있는 시스템의 존재가 미미한 상황에서 프로젝트를 기획하고 있는 기관에서 실행 자료로 활용하기에 좋은 자료이기에 소개한다. - 일반 현황 본 연구는 OCLC Research에 의해 실시된 2014년과 2015년 국제 링크드데이터 설문으로 20개 국가 90개(2014년 48개, 2015년 71개, 중복 29개)기관으로부터 수집된 응답을 분석하였다. 2015년에는 112개의 링크드데이터 프로젝트/서비스를 담당하는 링크데이터 구축자 및 소비자가 설문에 응하였다. 국가별 응답기관 수는 미국이 39개기관(43%)으로 가장 많았으며, 스페인이 10개, 영국이 9개, 네덜란드 6개, 노르웨이 4개, 캐나다 3개, 호주, 프랑스, 독일, 이탈리아, 스위스 각 2개, 오스트리아, 체코, 헝가리, 아일랜드, 일본, 말레이시아, 포르투갈, 싱가포르와 스웨덴 각 1개 기관이었다. 응답 기관을 성격별로 구분하면 국립도서관 14개, 학술도서관 23개, 연구기관 네트워크 9개, 정부기관 7개, 학술프로젝트 6개, 5개의 공공도서관, 박물관 3개, 3개의 학회와 한개의 출판사가 설문에 참여하였다. - 외부기관과의 협력 현황 35개 프로젝트는 외부 기관이나 단체와 협력하고 있지 않았다. 그러나 69%에 해당하는 대부분의 프로젝트는 데이터 연결을 위해 외부기관과 협력하고 있었다. 구체적으로 다른 대학이나 연구소, 도서관이나 아카이브, 컨설턴트나 개발자, 국가적 협력이나 컨소시엄 멤버, 시스템 벤더나 국제 협력 단체, 기업, 학회 등과 협력하고 있었다. - 담당 직원 현황 98개 프로젝트가 기존 직원에 의해 링크드 데이터 작업을 수행하고 있었다. 기존업무를 수행하던 직원에게 업무를 부과하는 경우, 정규직원으로 링크드 데이터 전문가를 고용하는 경우, 임시직으로 고용하는 경우, 외부 컨설턴트나 전문가를 고용하는 경우로 다양한 형태를 띄고 있다. - 예산 25개의 프로젝트가 링크드 데이터 프로젝트만의 자체 예산을 활용한다. 대부분의 프로젝트(82개)는 도서관이나 아카이브 혹은 모기관으로부터 예산을 지원받고 있다. 5개의 프로젝트는 협력 기관으로부터 지원 받으며, 1개의 프로젝트는 개인적인 예산 지원을 받고 있다. 대부분의 프로젝트가 링크드 데이터 업무의 초기단계이며, 프로젝트의 성공을 판단하는 요소로 '데이터 재사용(Data re-use)', '기관의 발전 가능성(Increased discoverability)', '새로운 지식의 생산(New knowledge creation)', '선도자의 역할(Thought leadership)', '시멘틱 웹에 대한 준비(Preparation for the semantic Web)', '성공적 업무 수행(Operational success)', '조직 발전(Organizational development)'과 '조직 개편(Organizational transformation)'를 제시하고 있다. - 링크드 데이터 생산 이유 링크드 데이터를 생산하는 주요 이유로는 '웹 상에 데이터를 더 많이 노출시키기 위해', 'dataset로 링크드 데이터가 적합한 것을 증명하기 위해', '링크드 데이트를 통해 로컬 데이터 노출시키는 것을 시도하고 반응을 살피기 위해', '링크드 데이터로 생성된 로컬 정보원 데이터을 검색엔진(SEO)에서 검색되게 하기 위해'가 있었다. 2014년과 2015년의 링크드 데이터 생산 이유를 비교하면 다음 표와 같다. 기타 사유로 '차후 프로젝트의 데이터로 재사용하기 위해', '데이터의 재사용과 상호호환성을 극대화 시키기 위해', 'BIBFRAME이나 schema.org를 테스트하기 위해', '프로젝트의 필요에 의해', '기관 내에서 사용하는 표준 연구데이터의 무결성과 안정성을 보장하기 위해'라는 답변이 있었다. 링크드 데이터 생성을 위해 사용하는 기술로는 대부분 여러 기술을 혼합하여 사용하고 있었으며, 사용된 기술은 다음 표와 같다. 링크드 데이터 생성의 장애요인으로는 '직원의 학습에 많은 시간과 노력이 소모되는 것', '일관성 없는 레거시 데이터', '데이터 표현에 적합한 온톨로지를 선택하는데의 어려움', '링크 구축 방법', '구축 시스템에 대한 안내서 부족', '도구의 부족', '사용이 불편한 소프트웨어', '데이터 소유권 문제' 등이 있다고 답변하였다. - 링크드 데이터 사용 이유 링크드 데이터를 사용하는 기관에서 데이터 연결을 위해 사용하는 사이트는 ViAF, DBpedia, GeoNames, id.loc.gov 순이다. 링크드 데이터의 주요 사용 이유는 '사용자에게 풍부한 경험을 제공하기 위해서', '다른 자원으로부터 연결된 데이터를 사용하여 로컬 데이터의 성능을 향상시키기 위해', '보다 효과적인 메타데이터 관리를 위하여', '검색 결과의 정확성을 향상시키고 범위를 확장하기 위해' 등이며, 2014년과 2015년의 응답 비율은 다음 표와 같다. 링크드 데이터 사용의 장애요인으로 '원본 데이터와 연결 데이터 간의 명확한 일치의 어려움', '용어 대응의 어려움', '부정확하거나 사용하기에 정보가 부족한 URI', '전거 통제의 부족', '업데이트가 되지 않는 dataset', 'RDF 덤프 용량의 크기', '데이터 형태의 휘발성', '도구의 부족(불완전한 엔드포인트)', '타기관에서 사용하는 객체와 개념 사이의 연결에 대한 의미 파악의 어려움', '타 언어 간 용어의 명확한 해석의 문제' 등을 대답하였다. - 주요 사례 1. 국립도서관 British Library는 ISNI와 VIAF 식별자를 활용한 링크드 데이터 서지 정보 DB를 구축하였다. German National Library는 German National Bibliography, German Integrated Authority File (GND), BIBFRAME prototype과 Entity Facts라는 4개의 프로젝트를 링크드 데이터로 구축하고 있다. Entity Facts의 서비스 화면은 다음 그림과 같다. 2. 연합체 Digital Public Library of America는 미국의 기록관, 도서관, 박물관 등의 자원 중 저작권이 공개된 콘텐츠를 링크드 데이터로 서비스 하고 있다. Europeana는 유럽 전반의 도서관, 박물관 등을 통해 메타데이터를 수집하고 있으며 EDM(Europeana Data Model)을 통해 시멘틱 웹 원칙을 지키고 있다. OCLC는 도서관 전거 파일과 MARC를 통해 2천만여개의 RDF triple을 분석하여 링크드 데이터로 구축하였다. 3. 대학도서관과 공공도서관 North Carolina State University`s Organization Name Linked Data는 VIAF, LCNAF, DBpedia, Freebase, ISNI 식별자 등과 링크드 데이터를 생성하여 서비스하고 있다. 많은 공공도서관들이 LibHub 등의 네트워크에 소속되어 서지 정보를 SPARQL을 사용하여 연결하고 있으며, 노르웨이의 공공도서관들은 서지정보와 서평을 연결하는 링크드 데이터를 구축하여 서비스하고 있다. 4. 학술연구 프로젝트와 출판사 Dalhousie University`s Institute for Big Data Analytics는 1차 세계대전 기록자료를 수집하고 링크드 데이터를 생성하는 기관으로 Muninn 프로젝트를 진행중이다. The Pratt Institute는 Linked Jazz 프로젝트를 통해 디지털 자원과 이용자의 경험을 연결시키고 있다. Springer는 링크드 오픈 데이터를 통해 출판물과 저자, 주제와 회의 정보 등을 연결하고 있다. http://www.dlib.org/dlib/july16/smith-yoshimura/07smith-yoshimura.html |