내용 |
때때로 연구를 지원하는 주요 데이터 이용을 제공하지 않는 곳에서 논문 발표가 이뤄지는 경우가 있다 . 대용량 데이터 세트를 누구나 영구적으로 액세스 할 수 있도록 만드는 것은 제한적이기 때문이다 . 원시 데이터 (raw data) 가 공개 아카이브에 기탁되는 경우에도 필수적인 분석 매개수단 , 스크립트 , 소프트웨어는 이용할 수 없는 경우가 빈번하다 . GigaScience 저널은 연관된 데이터 저장 및 배포 포털이라 할 수 있는 ' GigaScience 데이터베이스 (GigaDB)' 를 통해 이 문제를 해결하려 하고 있다. 본문을 통해 GigaDB 의 최신 버전을 설명하고 차세대 개선을 위한 계획을 밝히고자 한다 . 생명과학 분야는 각 분야에 상응하는 출판된 동료평가 학술논문 (peer-reviewed article) 수의 꾸준한 증가를 통해 최근의 기술 진보를 모두 담아내고 있다 . 유전학 / 유전체학의 차세대 서열이든 , 단백질 유전 정보학의 고처리 용량 질량 분석법이든, 신진대사체학이든, 또는 단일 분석에서 복수 데이터 형태를 통합하는 것이든 모든 분야에서 그렇다. 과학 출판에서 이상적인 것은 연구자들이 자신이 결론을 도출해냈던 데이터를 제공하여 동료 및 논평자들이 그들의 주장을 확인하기 위해 그 데이터를 재검토할 수 있도록 하는 것이다 . 그러나 커뮤니티의 리포지터리가 없거나 그 용량이 부족하다는 이유 때문에 기본 데이터를 이용할 수 있도록 제공하는 곳에서 논문을 출판하지 못하는 경우가 꽤 자주 발생한다 . 이것은 그 연구 결과를 독립적으로 검증할 수 있는 기회를 가질 수 없다는 것을 의미한다 . 때때로 원시 데이터가 아카이브에 기탁될 때도 있지만 , 필수적인 분석 매개수단 , 스크립트 , 소프트웨어까지 이용할 수 있는 상태가 아니다 . 이 또한 연구 결과를 다른 사람이 재현할 수 없음을 의미한다 . 좋은 과학이란 해법을 발견할 뿐만 아니라 , 더 많은 질문을 생성하는 것을 말한다 . 그러므로 출판사들은 과학자들이 어떤 연구 결과를 읽고 유효성을 검증할 수 있도록 자료를 제공 할뿐만 아니라 , 그들이 스스로 의문을 가지고 그 데이터를 조목조목 따져볼 수 있도록 하는 것 까지 제공해줄 수 있도록 시도해야 할 것이다 . 영향력이 큰 저널의 다수가 데이터의 공적 이용가능성 및 공유와 관련된 편집 정책을 설정하고 있음에도 불구하고 , 한 연구에 따르면 원시 데이터 전체를 기탁하고 있는 논문은 10% 미만에 불과하다고 한다 . 더불어 기술의 급속한 발전에 따라 데이터 분석을 위한 많은 , 때로 검증되지 않은 , 소프트웨어 솔루션의 즉각적 개발이 나타나고 있다 . 불행히도 코드의 이용가능성 정책은 데이터 공개 정책보다 훨씬 더 저조하다 . 연구결과의 정확한 검증을 위하여 , 연구에 사용된 소프트웨어 도구들도 이용가능 해야 하며 논문의 연구방법에는 소프트웨어 버전과 각 단계에서 사용된 파라미터가 포함되어 있어야 한다 . 일부는 심지어 하드웨어가 분석에 영향을 미칠 수 있으므로 소프트웨어가 항상 일관되게 움직이도록 하기 위해 가상 기계를 만들고 사용할 것을 지지한다고 주장하기도 한다 . 이러한 연구의 재현가능성의 간극을 해결하는 것을 목표로 하여 GigaDB는 논리적 근거 및 최근의 데이터 출판 생태계 , GigaScience 저널과의 관계와 통합 , 보유 데이터의 형태 , 표준 (standard) 의 사용과 DOI(Digital Object Identifier) 에 의한 데이터 인용 , 그리고 데이터베이스에 대한 계획된 추가사항 및 개선사항 에 관한 것을 고민하고 있다. 출판된 데이터의 재사용을 최대화하는 것은 그것을 메타 데이터와 함께 축적하는 것뿐만 아니라 표준화된 형태의 오픈액세스 리포지터리로 만드는 것까지 포함한다 . 과학 논문에 발표된 연구결과는 재현이 가능해야한다 . GigaDB 는 인용할 수 있는 DOI 를 포함한 오픈 액세스 데이터베이스를 지원하는 관점에서 연구 커뮤니티에 서비스하는 것으로 자리매김을 하고 있다 . DATABASE http://database.oxfordjournals.org/?code=databa homepage.x=98 homepage.y=6 .cgifields=code GigaDB http://gigadb.org/ GIGA Science http://www.gigasciencejournal.com/ |