여러 학문 분야에서 데이터의 공유와 재이용에 관한 관심이 증가하고 있다. 실제로 다른 연구자의 데이터를 다시 연구에 사용하고 인용을 부여하는 관행이 서서히 자리를 잡아가고 있다. 이러한 변화를 반영하여 톰슨로이터는 Data Citation Index(DCI)라는 데이터인용 색인 데이터베이스 서비스를 2012년부터 제공하기 시작하였다. DCI는 모든 학문의 전 영역에서 데이터의 인용 현황을 저널의 논문과 유사하게 집계한다. 본 연구에서는 데이터인용이 활발한 사회학 분야의 인용된 연구데이터를 분석하여 해당 분야의 특성과 지적구조를 규명하고자 하였다. 이를 위해 논문 인용을 기반으로 한 사회학 분야의 지적구조와 비교하였으며, 사회학 분야의 연구데이터의 특성과 고유한 지적구조를 살펴보고자 하였다. 분석을 위한 데이터는 두 종류로 수집하였다. 첫째는 DCI에서 ‘Sociology’로 주제 검색을 수행하여 총 8,365건의 인용된 데이터를 수집하였다. 둘째로, 논문 인용 분석과의 비교를 위해서 Web of Science에서 ‘Sociology’로 주제 검색을 수행하여 총 12,132건의 데이터를 수집하였다. 이 두 데이터를 활용하여 저자키워드 동시출현단어 분석을 수행한 결과, 데이터를 기반으로 한 사회학 분야는 2영역 15군집으로 구성된 반면, 논문을 기반으로 한 사회학 분야는 3영역 17군집으로 나타났다. 내용적인 특성을 살펴보면, 전통적으로 사회학의 지적구조를 나타낸다고 볼 수 있는 논문 기반 사회학과 달리 사회학 분야의 연구데이터는 의학 분야와의 활발한 접목을 찾아볼 수 있으며, 그 중에서도 공중보건과 심리학이 중심 영역인 것으로 나타났다.
Through a wide variety of disciplines, practices on data access and re-use have been increased recently. In fact, there has been an emerging phenomenon that researchers tend to use the data sets produced by other researchers and give scholarly credit as citation. With respect to this practice, in 2012, Thomson Reuters launched Data Citation Index (DCI). With the DCI, citation to research data published by researchers are collected and analyzed in a similar way for citation to journal articles. The purpose of this study is to identify the characteristics and intellectual structure of sociology field based on research data, which is one of actively data-citing fields. To accomplish this purpose, two data sets were collected and analyzed. First, from DCI, a total of 8,365 data were collected in the field of sociology. Second, a total of 12,132 data were collected from Web of Science with a topic search with ‘Sociology’. As a result of the co-word analysis of author provided-keywords for both data sets, the intellectual structure of research data-based sociology was composed of two areas and 15 clusters and that of article-based sociology was composed with three areas and 17 clusters. More importantly, medical science area was found to be actively studied in research data-based sociology and public health and psychology are identified to be central areas from data citation.
조재인. (2016). Data Citation Index를 기반으로 한 연구데이터 인용에 관한 연구. 한국문헌정보학회지, 50(1), 189-207. http://dx.doi.org/10.4275/KSLIS.2016.50.1.189.
Christopher W. Belter. (2014). Measuring the Value of Research Data: A Citation Analysis of Oceanographic Data Sets. PLoS ONE, 9(3), e92590-. http://dx.doi.org/10.1371/journal.pone.0092590.
Piero Dalerba. (2016). CDX2 as a Prognostic Biomarker in Stage II and Stage III Colon Cancer. New England Journal of Medicine, 374(3), 211-222. http://dx.doi.org/10.1056/nejmoa1506597.
Anne R. Diekema. (2014). The NSF/NIH Effect: Surveying the Effect of Data Management Requirements on Faculty, Sponsored Programs, and Institutional Repositories. The Journal of Academic Librarianship, 40(3-4), 322-331. http://dx.doi.org/10.1016/j.acalib.2014.04.010.
European Commission. (2015). Study on open science: Impact, implications and policy options. https://ec.europa.eu/research/innovation-union/pdf/expert-groups/rise/study_on_open_science-impact_implications_and_policy_options-salmi_072015.pdf.
Bernard Lo. (2015). Sharing clinical trial data: Maximizing benefits, minimizing risk. JAMA, 313(8), 793-794. http://dx.doi.org/10.1001/jama.2015.292.
Hailey Mooney. (2012). The Anatomy of a Data Citation: Discovery, Reuse, and Credit. Journal of Librarianship and Scholarly Communication, 1(1), 1-16. http://dx.doi.org/10.7710/2162-3309.1035.
National Cancer Institute. (2006). Data sharing policy. https://ctep.cancer.gov/protocolDevelopment/docs/data_sharing_policy.pdf.
National Institutes of Health. (2003). NIH data sharing policy and implementation guideline. https://grants.nih.gov/grants/policy/data_sharing/data_sharing_guidance.htm.
Omwoyo Bosire Onyancha. (2016). Open Research Data in Sub-Saharan Africa: A Bibliometric Study Using the Data Citation Index. Publishing Research Quarterly, 32(3), 227-246. http://dx.doi.org/10.1007/s12109-016-9463-6.
C PARR. (2005). Data sharing in ecology and evolution. Trends in Ecology & Evolution, 20(7), 362-363. http://dx.doi.org/10.1016/j.tree.2005.04.023.
R. D. Peng. (2011). Reproducible Research in Computational Science. Science, 334(6060), 1226-1227. http://dx.doi.org/10.1126/science.1213847.
(2017). QS World University Rankings. https://www.topuniversities.com/university-rankings/university-subject-rankings/2017/sociology.
Nicolas Robinson-García. (2016). Analyzing data citation practices using the data citation index. Journal of the Association for Information Science and Technology, 67(12), 2964-2975. http://dx.doi.org/10.1002/asi.23529.
J. S. Ross. (2012). Publication of NIH funded trials registered in ClinicalTrials.gov: cross sectional analysis. BMJ, 344(jan03 1), d7292-d7292. http://dx.doi.org/10.1136/bmj.d7292.
Simberloff, D.. (2005). Long-lived digital data collections: Enabling research and education in the 21st century:National Science Foundation.
T. L. Spires-Jones. (2016). Opening up: open access publishing, data sharing, and how they can influence your neuroscience career. European Journal of Neuroscience, 43(11), 1413-1419. http://dx.doi.org/10.1111/ejn.13234.
Stodden, V.. (2014). Implementing reproducible research:CRC Press.
이재윤. COOC ver 0.4 프로그램 [cited 2017.02.06.].
이재윤. WNET ver 0.4.1 프로그램 [cited 2017.02.06.].