기업조회

본문 바로가기 주메뉴 바로가기

동향 기본정보

OAI 기반 전 세계 리포지터리 통합 검색

동향 개요

기관명, 작성자, 작성일자, 내용, 출처, 원문URL, 첨부파일 순으로 구성된 표입니다.
기관명 NDSL
작성자 KISTI 정보서비스 동향지식 포털
작성일자 2010-08-26 00:00:00.000
내용 전 세계에 있는 오픈 액세스 학술정보만을 검색하는 서비스가 없을까라고 묻는다면, 답은 `할 수 있다`이다. 빌레펠트 대학 도서관이 운영하는 베이스학술검색엔진(Bielefeld Academic Search Engine, BASE)을 이용하면 전 세계에 있는 1722개 오픈 액세스 리포지터리를 통합검색할 수 있다. 2004년 9월부터 색인을 시작한 BASE 데이터베이스에는 2010년 7월까지 2천 5백만여 건의 오픈 액세스 학술정보가 색인되어 있다. 베이스 검색 엔진은 OAI 프로토콜을 준수하는 리포지터리에서 메타데이터를 수집하여 색인한다. [주1] 검색 - 21개 언어로 확장, 동의어 검색 지원 검색은 기본 검색과 고급 검색이 제공된다. 둘 모두에서 기본적으로 유로보크`Eurovoc` [주2] 시소러스를 선택할 수 있다. `기본 용어만`(basic terms only) 옵션을 선택하면 입력한 용어에 대한 21개 언어의 동의어를 동시에 검색할 수 있다. 다음으로 `기본 용어와 이형 동의어(비우선어)`(basic terms and used-for-terms) 옵션을 선택하면 입력 검색어와 21개 언어로 번역한 용어, 이형 동의어를 동시에 검색할 수 있다. 고급 검색에서는 1) 복수 검색필드(저자, 제목, 주제명표목, 웹주소, 발행처) 입력 가능. + 결과 표시 항목수 조정 가능 2) 검색어의 복수형과 다른 격(속격, 여격, 대격 등 격에 따른 형태 변화)을 같이 찾을지 여부 3) 콘텐츠 생산 국가 선택 4) 문서 형태 5) 출판년도(특정 연도를 선택하거나 시작점, 종료점 등 3가지로 선택할 수 있음) 검색 사례 실제로 검색을 수행하면 다음과 같다. 주제명표목 필드에서 `photon`을 검색했다. 검색 결과는 저자, 주제, 발행년, 출처, 언어, 문서 종류 항목에서 범위를 좁힐 수 있다. 범위를 좁히는 드롭다운 메뉴바에는 범위를 좁힐 경우 나타날 결과수의 비율을 알려준다. 아래 그림에서 검색창 옆에 표시되어 있듯이 검색 성능이나 콘텐츠에 만족하지 못할 때에는 구글 학술 검색으로 이동할 수 있는 통로를 제공한다. (클릭 시 해당 페이지로 이동) 아래는 언어를 한국어로 제한한 결과이다. 범위를 제한한 결과, 한국과학기술원에서 운영하는 KOASAS 리포지터리에 등록된 학술지 논문 5편이 나타난다.(국제적인 레지스트리에 등록된 국내 리포지터리는 별로 없다) 각 콘텐츠에 대한 정보에서는 학회 학술지일 경우 학회 웹사이트 주소가 표시되며 정보를 제공한 리포지터리에 대한 정보가 나타난다. (클릭 시 해당 페이지로 이동) 오픈 액세스 리포지터리는 OAI 프로토콜을 준수해 정보교환을 용이하게 하는 것을 기본적인 요건으로 한다. 빌레펠트 대학 도서관은 이런 데이터를 이용하고 자체적으로 색인하고 검색 엔진을 운영하여 다수 리포지터리를 통합적으로 검색하는 서비스를 제공하고 있다. 반면, 리포지터리 등록 대장인 레지스트리나 디렉터리를 운영하는 Eprints와 노팅엄 대학에서는 이와 다른 방식을 취한다. 둘 모두는 구글 맞춤 검색(custom search) 기능을 이용해 천 7백여 개 리포지터리를 통합검색할 수 있도록 한다. (클릭 시 해당 페이지로 이동) (클릭 시 해당 페이지로 이동) 베이스학술검색엔진은 고급 검색 기능과 EuroVoc 시소러스 등을 제공한다. 그리고 리포지터리의 특징인 OAI 프로토콜 준수라는 특성을 활용한 학술콘텐츠 전용 검색엔진이다. 반면 구글 검색 엔진은 세계적으로 인정 받는 검색엔진이다. 이용자에게 제공하는 편리함이란 측면에서는 베이스 엔진이 더 많은 것을 제공하지만 구글의 검색 능력과 비교했을 때 결과적으로 이용자가 어느 것을 선택할 지 귀추가 주목된다. [주1] 2010년 8월 23일 현재 오픈 액세스 리포지터리에 등록된 전 세계 리포지터리는 영국 사우샘프턴 대학에서 운영하는 Epirnts에서 제공되는 Repository of Open Access Repository(ROAR)를 기준으로 1839개이다. 반면, 노팅엄 대학에서 운영하는 Directory of Open Access Repositories(OpenDOAR)에 등록된 리포지터리 1702개이다. 베이스 학술검색엔진은 두 레지스트리에 등록된 리포지터리를 검색 대상으로 한다. 두 레지스트리와 베이스학술검색엔진을 비교해보면 리포지터리 대부분이 OAI 프로토콜을 준수하고 있는 것으로 나타난다. [주2] EuroVoc은 유럽의 22개 언어와 크로아티아, 세르비아 언어를 포괄하는 다언어, 다학제적 시소러스이다. 현재는 온톨로지로 확장하고 있으며 W3C에서 제안하는 시맨틱 웹 기술을 적용할 수 있도록 나아가고 있다. 시소러스 관리는 유럽연합 출판사무국에서 담당한다.
출처
원문URL http://click.ndsl.kr/servlet/OpenAPIDetailView?keyValue=03553784&target=TREND&cn=IWT201008044
첨부파일

추가정보

과학기술표준분류, ICT 기술분류, 주제어 순으로 구성된 표입니다.
과학기술표준분류
ICT 기술분류
주제어 (키워드) 1. 통합검색; 오픈아카이브이니셔티브 2. integrated search; open archive initiative; oai