내용 |
STM 출판사 협회의 새로운 표준라이선스를 철회해 달라는 요청은 CC 라이선스가 사실상의 국제 표준이라는 사실에 주목한 것이다. 그러나 종종 CC 라이선스는 연구자들을 위해 `설계되지 않았고(not designed)`, 과학기술 분야에서 아직 `검증되지 않은(not proven)` 것이라는 비난을 받기도 한다(STM 출판사 협회의 답변에서처럼). 우리는 외부에 있는 수많은 선행연구들을 바탕으로 몇몇 데이터를 획득하는데 유용할 것이라고 생각했다. 이는 쓸데없는 염려임이 밝혀졌지만, 합리적인 하한을 찾아낼 수 있게 되었다고 생각한다. 한마디로 말하자면, 세상에는 적어도 CC 라이선스를 도입한 학술 논문이 120만 건이 있고, 그 중 72만 건은 CC BY 라이선스를 도입하고 있다. 우리의 첫 번째 요청은 오픈액세스 저널 디렉토리(Directory of Open Access Journals, 이하 DOAJ)이다. DOAJ는 저널리스트와 함께 해당 저널의 기본 라이선스를 포함하여 논문 메타데이터를 제공해 줄 수도 있다. 검색 페이지에는 논문 검색을 제한할 수 있는 옵션이 있고, 라이선스 선택 탭을 클릭하면 서로 다른 CC 라이선스 하에 등록된 수많은 논문들을 얻을 수 있다. 이에 따라 CC BY 라이선스 논문이 547,138건, CC BY-NC 라이선스 논문이 311,956건 가량, 총 약 백만 건 이상의 CC 라이선스 논문이 검색된다. 그러나 이러한 것은 이 상황에 대한 완전한 표현은 아닐 것이다. 많은 대형 출판사들은(PLOS를 포함) DOAJ와 같이 논문 수준의 메타데이터를 두고 있지 않다. 때문에 1만 건은 감소된다. 순수 OA 저널을 발행하는 일부 출판사들을 위해, 우리는 2013년까지 CC BY 라이선스 논문들을 중심으로 OASPA로부터 데이터를 받았다. DOAJ 데이터세트에서 빠진 가장 큰 기고자는 Springer Open, PLOS, OUP, MDPI 이다. 이 출판사들은 2013년 말까지 144,203건의 논문을 더 기고해서 전체 110만 건이 넘어선다. 여기에다 2014년에 PLOS에서 출간한 22,000여건과 Springer Open에서 발행한 3,463건을 추가할 수 있다(DOAJ 회원 중에 하나인 Biomed Central의 논문은 제외). 여기에는 보다 자세한 차이가 있다. NPG의 Scientific Reports는 CC 라이선스를 사용하고(Pubmed에 따르면 5,793건) Nature Communications는 오픈액세스 논문들에 CC 라이선스를 사용한다(이곳 데이터세트에서 총 1,026건의 오픈액세스 논문을 제공받았다.). Nature Communications는 우리가 가지고 있는 지식에 큰 차이를 보여준다. 우리는 Wiley, Taylor, Francis, Sage, OUP, Elsevier와 같은 큰 출판사들의 하이브리드적인 제공 서비스로 CC 라이선스가 실절적인 활용되고 있다는 것을 알고 있지만, 당장에는 그 규모에 대해선 제한된 정보를 가지고 있다. 정보의 소스와 질은 올해 말까지 실질적으로 개선될 전망이지만, 지금 이 순간 할 수 있는 최선의 것은 아직 수백만은 아니만 적어도 그 양이 수만 건 정도는 되게 하는 것이다. 때문에 현재 견적에서 그들은 뺀다. 몇 가지 주의사항 - 여기에는 다양한 논문들이 누락되어 있다. 특히나 DOAJ에 등록되지 않은 저널을 가지고 있는 소규모의 출판사들에서 발행한 논문들이다. 그러나 만약 이것을 합리적인 하한이라고 주장하려면 이중으로 카운트 하지 않는다는 확신이 필요하다. DOAJ에 있는 논문들 외에 추가한 모든 출판사들을 검색해보면 PLOS(650)와 Springer(99)를 제외할 경우 아무런 결과가 나오지 않는다. 또한 Springer의 상당수의 논문들을 누락시키기도 한다. 그들은 최근 Biomed Central과 Springer Open을 포함한 다양한 출판사로부터 20만 건에 달하는 CC 라이선스를 도입한 OA 논문을 발표했다. 계산에 따르면 총수가 Biomed Central(DOAJ를 거친)이 136,895건, Springer Open(OASPA 데이터와 2014년 검색을 토대로)이 18,375건이다. 따라서 내가 누락시킨 논문이 45,000건 정도 있다. 마찬가지로 OUP에 최근에 CC 라이선스를 도입한 Nucleic Acids Research와 같은 저널에 있는 만 건 정도의 논문을 누락시켰다. 이러한 수치에 대한 한 비판으로 DOAJ는 보다 엄격해진 품질 조건에 부합하지 않는다는 이유로 최근에 삭제된 일부 저널을 포함하고 있다는 사실이 제기될 수 있다. 그렇다면 수치가 의심스러운 저널들을 포함해야 할까? 수량에 대한 논의는 논문 데이터베이스 제공와 라이선스 문제에 대해서 고민하고 있는 출판사들이 가장 신뢰할 만하는 경향이 있다는 것이다. 그곳에 데이터가 전혀 없다는 사실을 보여주는 것은 부정적인 출판사들에게 아주 좋은 지표이다. 전반적으로 봤을 때 빠뜨리고 카운트를 하는 것과 대량의 논문을 기고하는 잠재적인 문제간의 균형은 거의 해소될 것이라고 생각한다. 전체 총 수치는 CC 라이선스를 가진 논문이 120만 건을 조금 넘는 것으로 나온다. 이 중 적어도 724,000건은 CC BY 라이선스를 사용한다. 물론 내가 제시한 링크를 통해 내 계산을 확인할 수 있다. 데이터는 연단위로 나눠질 수도 있고 누락된 데이터로 혼란스러울 수도 있지만 전체 문헌의 상당부분을 차지하는 대략 20만 건의 CC 라이선스 논문들이 2012년과 2013년에 공개되었다. 전에 우리가 말했던 것처럼(80개가 넘는 기관들이 요청서에 서명), CC는 학술적인 집단뿐만 아니라 웹상의 폭넓은 콘텐츠에서도 수립되고, 적용되면 검증된 표준이라는 것이라는 것을 다시 한 번 언급한다. DOAJ http://doaj.org/ |