
본문 바로가기 주메뉴 바로가기

ACOMS+ 및 학술지 리포지터리 설명회

  • 한국과학기술정보연구원(KISTI) 서울분원 대회의실(별관 3층)
  • 2024년 07월 03일(수) 13:30


검색어: 데이터논문, 검색결과: 90
변우영(명지대학교 기록정보관리학과) ; 임진희(명지대학교 기록정보과학전문대학원) 2022, Vol.39, No.1, pp.195-217 https://doi.org/10.3743/KOSIM.2022.39.1.195

SIARD_KR은 스위스 연방 기록보존소에서 개발한 관계형 데이터베이스 컨텐츠의 장기보존에 이용하는 기술인 SIARD를 우리나라의 실정에 맞게 일부 수정한 행정정보 데이터세트 보존 도구이다. 기존의 선행연구는 SIARD가 얼마나 관계형 데이터베이스안에 들어있는 모든 데이터를 손실 없이 잘 추출할 수 있는지에 초점이 맞춰져 있다. 하지만 데이터베이스에 들어있는 데이터 전부가 의미 있는 정보, 즉 행정정보 데이터세트는 아니다. 따라서 이 논문은 SIARD_KR이 행정정보 데이터세트의 특성을 반영하고 있는가에 대한 문제의식에서 시작한다. SIARD_KR이 단순히 DB에 저장된 데이터를 추출하는 도구가 아니고 의미 있는 정보만을 식별하여 추출할 수 있을지, 본래의 시스템에서 유리되어도 의미 있는 정보를 유지할 수 있을지 확인하려 한다. 본 논문은 SIARD_KR의 구조를 분석하고, 예상되는 문제점을 도출하여 그에 대한 개선방안을 제시하는 것을 목적으로 한다.


SIARD_KR is an administrative information dataset preservation tool. It is a partially modified version of SIARD, technology used for long-term preservation of relational databases developed by the Swiss Federal Archives, to suit Korea’s situation better. Previous studies have focused on how SIARD is able to effectively extract all data contained in the relational database without loss. However, not all data contained in the database is meaningful information, that is, an administrative information dataset. This paper began, therefore, with the awareness of the problem of whether SIARD_KR reflects the characteristics of the administrative information dataset. SIARD_KR is not only a tool for extracting data stored in the DB. We want to see if it is capable of identifying and extracting only meaningful information, and maintaining meaningful information, even if it is separated from the original system. The purpose of this paper is to analyze the structure of SIARD_KR, identify expected problems, and suggest improvement measures for them.

이재윤(명지대학교 문헌정보학과) 2023, Vol.40, No.4, pp.403-428 https://doi.org/10.3743/KOSIM.2023.40.4.403

이 연구에서는 데이터 리터러시 분야 연구의 발전 경로와 지적구조 및 떠오르는 유망 주제를 파악하고자 하였다. 이를 위해서 Web of Science에서 검색한 데이터 리터러시 관련 논문은 교육학 분야와 문헌정보학 분야 논문이 전체의 60% 가까이를 차지하였다. 우선 인용 네트워크 분석에서는 페이지랭크 알고리즘을 사용해서 인용 영향력이 높은 다양한 주제의 핵심 논문을 파악하였다. 데이터 리터러시 연구의 발전 경로를 파악하기 위해서 기존의 주경로분석법을 적용해보았으나 교육학 분야의 연구 논문만 포함되는 한계가 있었다. 이를 극복할 수 있는 새로운 기법으로 페이지랭크 주경로분석법을 개발한 결과, 교육학 분야와 문헌정보학 분야의 핵심 논문이 모두 포함되는 발전 경로를 파악할 수 있었다. 데이터 리터러시 연구의 지적구조를 분석하기 위해서 키워드 서지결합 분석을 시행하였다. 도출된 키워드 서지결합 네트워크의 세부 구조와 군집 파악을 위해서 병렬최근접이웃클러스터링 알고리즘을 적용한 결과 대군집 2개와 그에 속한 소군집 7개를 파악할 수 있었다. 부상하는 유망 주제를 도출하기 위해서 각 키워드와 군집의 성장지수와 평균출판년도를 측정하였다. 분석 결과 팬데믹 상황과 AI 챗봇의 부상이라는 시대적 배경 하에서 사회정의를 위한 비판적 데이터 리터러시가 고등교육 측면에서 급부상하고 있는 것으로 나타났다. 또한 이 연구에서 연구의 발전경로를 파악하는 수단으로 새롭게 개발한 페이지랭크 주경로분석 기법은 서로 다른 영역에서 병렬적으로 발전하는 둘 이상의 연구흐름을 발견하기에 효과적이었다.


This study investigates the development path and intellectual structure of data literacy research, aiming to identify emerging topics in the field. A comprehensive search for data literacy-related articles on the Web of Science reveals that the field is primarily concentrated in Education & Educational Research and Information Science & Library Science, accounting for nearly 60% of the total. Citation network analysis, employing the PageRank algorithm, identifies key papers with high citation impact across various topics. To accurately trace the development path of data literacy research, an enhanced PageRank main path algorithm is developed, which overcomes the limitations of existing methods confined to the Education & Educational Research field. Keyword bibliographic coupling analysis is employed to unravel the intellectual structure of data literacy research. Utilizing the PNNC algorithm, the detailed structure and clusters of the derived keyword bibliographic coupling network are revealed, including two large clusters, one with two smaller clusters and the other with five smaller clusters. The growth index and mean publishing year of each keyword and cluster are measured to pinpoint emerging topics. The analysis highlights the emergence of critical data literacy for social justice in higher education amidst the ongoing pandemic and the rise of AI chatbots. The enhanced PageRank main path algorithm, developed in this study, demonstrates its effectiveness in identifying parallel research streams developing across different fields.

안병군(한국과학기술정보연구원) ; 변제연(성균관대학교 문헌정보학과) 2023, Vol.40, No.1, pp.225-258 https://doi.org/10.3743/KOSIM.2023.40.1.225

본 연구는 국내 연구자가 저술한 논문의 데이터 가용성 진술(DAS)에 명시된 데이터 공유 메커니즘과 리포지터리를 조사함으로써 국내 연구자의 연구데이터 공유 현황과 특징을 탐구하는 것을 목적으로 한다. 이를 위하여 2014년부터 2022년까지 PLOS ONE에 게재된 국내기관 소속 연구자의 논문을 연구의 대상으로 선정하였다. 우선 논문 내 DAS 존재 현황을 파악하고 선행연구를 활용하여 데이터 공유 메커니즘의 유형을 분석하였으며, 시간의 흐름에 따른 데이터 공유 메커니즘별 변화 추이 등을 조사하였다. 그 결과, 대상 논문의 99.6%에 DAS가 작성되어 있으며 데이터 공유 메커니즘의 유형별 언급 양상은 국제적인 양상과 유사하되, 시간의 흐름에 따라 선호되는 유형이 변화하고 있음을 파악하였다. 이후 데이터 공유 메커니즘 중 리포지터리에 주목하여 DAS에 언급된 리포지터리의 횟수와 비율을 파악하고 다수 언급된 5개 리포지터리의 이용 변화 추이를 시계열적으로 분석하였다. 또한 리포지터리와 함께 언급된 데이터 접근점의 제시 방식과 유형, 유효성 등도 함께 조사하였다. 이를 통해 빈번하게 언급되는 상위 5개 리포지터리가 전체 리포지터리 언급의 60%를 차지하며 데이터 코드를 다루는 리포지터리의 이용이 증가하는 현황이 확인되었고, 리포지터리와 함께 제시된 데이터의 접근점은 대부분 유효하다는 사실을 파악할 수 있었다.


The purpose of this study is to investigate the current status and characteristics of research data sharing by domestic researchers by analyzing the data sharing mechanism and repository specified in DAS of papers authored by domestic researchers. To this end, in this study, papers of researchers belonging to domestic institutions published in PLOS ONE from 2014 to 2022 were selected as the subject of the study. First of all, the status of DAS’s existence in the papers was identified, the types of data-sharing mechanisms were analyzed using precedent studies, and the trend of changes in each data-sharing mechanism over time was investigated. As a result, it was found that DAS was written in 99.6% of the target papers, and the types of data-sharing mechanisms were similar to international patterns, but preferred types were changing over time. Afterward, focusing on repositories among data sharing mechanisms, the number and ratio of repositories mentioned in DAS were identified, and the trend of changes in use of the five repositories mentioned a lot was analyzed in a time series. In addition, the presentation method, type, and validity of the data access point mentioned along with the repository were also investigated. It was confirmed that the top five frequently mentioned repositories account for 60% of all repository mentions, and the use of a repository dealing with data codes is increasing; in addition, it was found that most of the data access points presented with the repository were valid.

김지현(이화여자대학교) ; 정은경(이화여자대학교) ; 윤정원(University of South Florida) ; 이재윤(명지대학교) 2017, Vol.34, No.1, pp.7-29 https://doi.org/10.3743/KOSIM.2017.34.1.007

학술 커뮤니티 내에서 논문의 인용은 보편적인 규범으로 자리 잡은 데 비해 데이터의 인용은 아직 초보적인 단계에 머물러 있다. 이를 개선하기 위해 제기되고 있는 데이터 인용의 필요성 및 원칙과 가이드라인에 대해서 살펴보았다. 또한 데이터 인용체계 구축 사례에서는 데이터 인용 요소들을 정의하고 서비스를 제공하는 DataCite, Dataverse Network, Data Citation Index 사례를 중심으로 살펴보았다. 마지막으로 한국종합사회조사 데이터 인용 분석을 통해 국내 데이터세트 인용/이용 정보 제공 실태를 조사하였다.


Data citation remains in its infancy, although providing the citation to a journal article is a typical norm in an academic community. This study examines the need for data citation, its principles and guidelines for improving the issue. In addition, the study investigates cases that established data citation mechanism, including DataCite, Dataverse Network and Data Citation Index that define elements of data citation and provide relevant services. At the end, it explores the current state of data citation in Korea through the analysis of citations to dataset from Korean General Social Survey.


본 연구에서는 ISA 데이터베이스를 이용해서 국가별 즉, 한국과 일본의 문헌정보학 연구자들의 연구동향을 규명하기 위하여 세계적인 데이터뱅크인 DIALOG에서 운영하는 문헌정보학분야의 대표적인 데이터베이스인, ISA 데이터베이스에 수록된 논문을 대상으로 다각적인 측면에서 분석하였다. 또한 ISA 데이터베이스에 수록된 문헌에서 인용한 문헌을 형태별 / 연도별 및 국내외별로 분석함으로써 한국과 일본의 문헌정보학 연구자들의 인용형태를 분석하였다. 본 연구는 향후 문헌정보학의 국제화 및 우리 학문의 연구방향을 제시 할 것으로 본다.


This study is to examine into the research pattern of the each country then, Korea and Japan's library and information science researchers through the ISA database, to analyze the thesis in various aspects which is included in ISA database. It analyzed such as leading authors production, subjects, journals etc. In addition, the study is to analyze the form of citation of Korea and Japan's library and information science researchers by studying the citation written in the thesis of the internationalization of library and information science and indicate the direction of our study in the future.

송민선(성균관대학교 정보관리연구소) ; 고영만(성균관대학교) 2015, Vol.32, No.3, pp.221-236 https://doi.org/10.3743/KOSIM.2015.32.3.221

본 연구의 목적은 한국학 분야 국내 학술지 논문 데이터를 대상으로 계층적 군집 분석을 적용해 한국학 분야의 지식 구조를 구성하는 연구 영역을 분석하는 것이다. 이를 위해 KCI에서 탑재된 한국학 관련 학술지 중 2011년~2013년도 기준 3년치 평균 Impact Factor 값이 0.5 이상이며, 2004년부터 2013년까지의 10년치 누적 논문 데이터를 갖고 있는 14종의 학술지에 수록된 논문 중 한글 저자키워드 데이터가 포함되어 있는 3,800편을 분석하였다. 분석 결과, 중심 연구 분야는 대체로 성리학과 실학 중심의 유교 사상을 기반으로 한 정치와 사회에 관한 연구, 한반도의 분단 체제를 둘러싼 정치 관련 연구, 그리고 일제 강점기에서 근현대의 역사인 것으로 나타났다. 시기적으로는 고대나 현대 시점보다는 조선시대부터 근대 시기까지를 대상으로 하는 연구들이 많은 것으로 나타났다.


The purpose of this study is to analyze the research fields constituting the knowledge structure of the Korean Studies by applying hierarchical clustering method to domestic journal papers in Korean Studies. We analyzed 3,800 papers containing Korean author keyword that were listed in 14 kinds of Korean Studies journals published in 2004-2013, which have average impact factor more than 0.5 in 2011-2013. The results of the analysis show that the central research fields are the subjects related to political & social problems based on Confucian ideas focusing on Neo-Confucianism(Seonglihak) and Realist School of Confucianism(Silhak), to the political situation associated with territorial division of the Korean peninsula, and to the history from the period of japanese colonialism to modern and contemporary. It has been also found that the temporal backgrounds of researches in domestic Korean Studies were related to the modern times and the Joseon Dynasty periods, rather than the time of the ancient and contemporary.

방승윤(순천향대학교) ; 주경수(순천향대학교) 2002, Vol.19, No.2, pp.49-67 https://doi.org/10.3743/KOSIM.2002.19.2.049

B2B 전자상거래와 같이 XML을 이용한 정보교환이 확산되고 있으며 이에 따라 상호 교환되는 정보에 대하여 체계적이며 안정적인 저장관리가 요구되고 있다. 이를 위해 XML 응용과 데이터 베이스간의 연계를 위한 다양한 연구가 이루어지고 있다. 특히 계층적 구조를 갖는 XML 파일을 다양한 형태의 데이터베이스에 저장하기 위한 데이터 모델링 방안이 요구된다. 본 논문에서는 UML을 이용한, 다양한 형태의 데이터베이스 기반의 XML 응용을 위한 통합설계 방법론을 제안한다. 이를 위하여 먼저 UML을 이용하여 W3C XML schema를 설계하기 위한 XML 모델링 방안을 제시하고, 아울러 교환되는 XML 파일을 저장 관리하기 위하여 객체-관계 데이터베이스 스키마와 객체지향 데이터베이스 스키마 그리고 관계형 데이터베이스 스키마 설계를 위한 데이터 모델링 방법을 제안한다.


Nowadays an information exchange on XML such as B2B electronic commerce is spreading. Therefore the systematic and stable management mechanism for storing the exchanged information is needed. For this goal there are many research activities for connection between XML application and database. Accordingly, A unified modeling methodology need to store the XML file on the variety database. In this paper, we propose a unified design methodology for XML applications based on variety databases using UML. To this goal, first we introduce a XML modeling methodology to design W3C XML schema using UML and second we propose data modeling methodology for object-relational database schema, object oriented database an schema and relational database schema to store efficiently XML data in databases.


본 논문은 C대학도서관의 학술정보시스템(LAS)에 구축되어 있는 장서와 대출기록 및 고객관련 데이터를 수집하여 이를 분석하고 그 결과를 고객관계관리(CRM)에 적용할 수 있는 방안을 제시하였다. 수집된 자료는 C 대학도서관에서 소장하고 있는 대출이 가능한 단행본 총 269,387책의서지데이타와고객 12,281명의 데이터, 이용자 대출기록 39,269건이었다. 대출기록 분석 데이터에서 관계변수로 이용자 신분, 대출빈도, 대출책수와 대출횟수, 출판년도를 추출하여 데이터 마이닝 기법으로 분석하고, 상관계수로 검증하였다.


The books and circulation-related data in the Library Automation System(LAS) of C-academic library were collected and analyzed, and also the method which may be applied to the Customer Relationship Management (CRM) based on the results was suggested in this paper. Collected data were 269,387 bibliographic data of books, 12,281 patron data, and 39,269 circulation records. User identity, circulation frequencies, total number of circulated books, and publication year as relation factor from the analyzed data of circulation records were extracted. They were also analyzed, and verified by correlation coefficient.


국내 학술연구의 동향을 구체적으로 파악하여 연구개발 활동의 체계적인 지원 및 평가는 물론 현재와 미래의 연구 방향을 설정할 수 있는 기초 데이터로서, 개별 학술지 논문에 표준화된 주제 범주(통제키워드)를 부여할 수 있는 효율적인 방안을 모색하였다. 이를 위해 한국연구재단 「학술연구분야분류표」 상의 분류 범주를 국내 학술지 논문에 자동 할당하는 과정에서, 자질선정 기법을 중심으로 자동분류의 성능에 영향을 미치는 주요 요소들에 대한 다각적인 실험을 수행하였다. 그 결과, 실제 환경의 불균형 데이터세트(imbalanced dataset)인 국내 학술지 논문의 자동분류에서는 보다 단순한 분류기와 자질선정 기법, 그리고 비교적 소규모의 학습집합을 사용하여 상당히 좋은 수준의 성능을 기대할 수 있는 것으로 나타났다.


As basic data that can systematically support and evaluate R&D activities as well as set current and future research directions by grasping specific trends in domestic academic research, I sought efficient ways to assign standardized subject categories (control keywords) to individual journal papers. To this end, I conducted various experiments on major factors affecting the performance of automatic classification, focusing on feature selection techniques, for the purpose of automatically allocating the classification categories on the National Research Foundation of Korea’s Academic Research Classification Scheme to domestic journal papers. As a result, the automatic classification of domestic journal papers, which are imbalanced datasets of the real environment, showed that a fairly good level of performance can be expected using more simple classifiers, feature selection techniques, and relatively small training sets.


저널을 중심으로 한 학술커뮤니케이션의 문제는 저작권 문제라고 할 수 있다. 영리적 기관이 논문의 저작권을 배타적으로 양도받아, 원문데이터베이스를 구축할 경우 가격상승으로 인한 이용의 제한과 보존의 문제가 발생한다. 본 연구는 이러한 문제를 해결할 수 있는 방안으로 정보공유적 학술커뮤니케이션에 대한 개념적 모델을 제시하였다. 이 모델은 저자가 저작권을 가지되, 학술적이고 비영리적인 이용일 경우 해당 저작물을 자유롭게 이용할 수 있다는 공유적 라이센스를 채택하도록 하는 것이다. 따라서 도서관이 학술논문의 원문데이터베이스를 구축하고 자유롭게 이용시킬 수 있으며, 학술정보의 보존문제도 해결할 수 있을 것이다.


The ownership of scholarly communication, i.e. copyright is very important to solve the problem of access to many academic journals in network environment. The purpose of this article is to give a conceptual model for the open access based scholarly communication. The main point of this model is for the authors of research paper to retain copyright on their works and to license the work whenever it is reproduced or redistributed for non-profit use with academic purpose. And library have to construct full text journal databases under this open access license.
