
본문 바로가기 주메뉴 바로가기

ACOMS+ 및 학술지 리포지터리 설명회

  • 한국과학기술정보연구원(KISTI) 서울분원 대회의실(별관 3층)
  • 2024년 07월 03일(수) 13:30


검색어: 데이터 제공자, 검색결과: 93

미래 도서관의 패러다임이 정보소장에서 정보접근으로 변화됨에 따라 도서관상호협력과 문헌제공서비스의 중요성이 증가하고 있다. 이를 위하여 개별 도서관들은 자료의 구입예산을 절감하고 도서관정보서비스의 질적인 향상을 물론 이용자의 정보서비스에 대한 만족도를 제고한다는 점에서 문헌제공서비스의 활용은 상당한 장점이 있다. 본 연구는 문헌제공서비스의 효과적인 수행과 이용을 위한 국내 이용자들의 문헌제공서비스 트랜잭션 데이터 분석을 통하여 문헌제공서비스의 이용추이와 동향을 예측하고, 여기에 나타난 그들의 요구변화를 검토하여 국내 도서관 및 정보센터의 문헌제공서비스의 질적인 향상과 이용자 만족도 제고에 사용할 수 있는 근거 자료를 제시하는데 그 목적이 있다. 이를 위하여 KISTI-DDS의 실제 이용데이터를 활용하여 문헌제공서비스의 연도별, 지역별, 이용계층별 차이를 분석하였으며, 자료유형별 복사추이도 관찰하였다. 또한 이용자들이 원문복사를 제공하는 복사제공기관과 원문입수방법을 검토하고 연도별, 이용계층별로 의미있는 차이가 있는지를 분석하였다.


The purpose of this study is to analyze the usage patterns of document delivery services of domestic users based on usage transaction data about photocopying services of KISTI-DDS that the most important document delivery organization in Korea. For the purpose of this study, it was investigated the number of processed document, type of favorite documents, ordering coverage for photocopying, delivery methods of photocopying documents for users in DDS(document delivery service) through transaction data of DDS during the past 4 years from 2000 to 2003.

김현희(명지대학교) ; 장우권(전남대학교) ; 곽병희(전북대학교) ; 안태경(대외경제정책연구원) 2005, Vol.22, No.3, pp.103-127 https://doi.org/10.3743/KOSIM.2005.22.3.103

본 연구에서는 두 단계를 거쳐서, 즉 리포지토리 운영에 필요한 이슈들을 제시한 SPARC 체크리스트 문헌 등을 분석하고(제 1 단계), 16개 국내외 대학의 리포지토리 운영현황을 사례 연구를 통해서 살펴본 후(제 2 단계), 리포지토리 운영에 중요한 여섯가지 요인을 추출하였다. 추출된 여섯가지 요인인 ①학내 합의 형성과 운영 체제, ②콘텐츠, ③지식 재산권, ④학내 동종 사업과의 제휴, ⑤기술과 시스템 및 ⑥도서리를 앞으로 구축할 계획 중인 대학은 물론 이미 구축된 리포지토리를 다각적으로 검토하여 활성화 방안을 모색하고 있는 대학에 하나의 지침이 될 것이다.


The purpose of the study is to implement the management model o f the institutional repositories for the efficient di ational knowledge focusing on the dCollection system which is operated by KERIS (service provider ). In order to build the management model, the two steps were utilized. The first step is to investigate the checklists epository implementation through literature review. On the other hand, the second one is to sur vey the current status of the sixteen domestic and foreign in stitutional repositories through interviews, surveys and email hrough the two steps, the management model including six components such as content and l ibrarian role was proposed. The proposed management model will be utilized to suply guide s both to the universities which plan to build their institutional repositories and to the universities which try to promote the activities of their repositories.


본 연구에서는 북미에서 연구데이터 관리 서비스를 제공하는 121개 대학도서관 중 연구데이터 관리 교육 프로그램을 제공하는 51개 기관을 대상으로 제공되는 교육 프로그램의 내용을 12개 데이터 리터러시 세부 역량에 기반을 두어 분석하고 시사점을 제시하는 것을 목적으로 하였다. 내용 분석을 위해 집합 교육 프로그램의 제목 317개와 온라인 튜토리얼의 상위 목차 제목 42개를 수집하였으며 선행연구에서 제시된 12개 데이터 리터러시 세부 역량에 따라 코딩을 수행하였다. 집합 교육 프로그램 중에서는 데이터 처리 및 분석 역량에 대한 교육 프로그램이 가장 많은 것으로 나타났으며, 가장 많은 수의 기관에서 데이터 관리 및 조직 역량에 대한 교육을 제공하고 있었다. 데이터 시각화 및 표현은 집합 교육 프로그램 중에서 세 번째로 많이 다루어지는 역량이었다. 그러나 나머지 9개 역량에 대한 교육 프로그램은 매우 적은 것으로 나타나 교육 프로그램 내용이 특정 역량에 집중되어 있음을 알 수 있다. 집합 교육 없이 자체 개발한 온라인 튜토리얼을 제공하는 기관은 5곳이었으며 목차 제목을 분석한 결과 데이터 보존, 윤리 및 데이터 인용, 데이터 관리 및 조직 역량에 대한 교육 내용을 중점적으로 다루고 있어 집합 교육 프로그램에서 강조되는 역량과 차이를 보였다. 효과적인 연구데이터 관리 교육 프로그램 운영을 위해서는 대학도서관 사서들이 전통적으로 교육하고 강조해왔던 역량뿐만 아니라 데이터 처리와 분석, 데이터 시각화와 표현 등 연구자들의 연구 결과 도출에 필요한 데이터 리터러시 세부 역량에 대한 이해와 지원이 요청된다. 또한 연구데이터 관리 서비스와 관련된 사서들의 계속 교육을 지원하는 교육 자원의 개발도 필요할 것이다.


This study aimed to analyze the content of Records Data Management (RDM) training programs provided by 51 out of 121 university libraries in North America that implemented RDM services, and to provide implications from the results. For the content analysis, 317 titles of classroom training programs and 42 headings at the highest level from the tables of content of online tutorials were collected and coded based on 12 data literacy competencies identified from previous studies. Among classroom training programs, those regarding data processing and analysis competency were offered the most. The highest number of the libraries provided classroom training programs in relation to data management and organization competency. The third most classroom training programs dealt with data visualization and representation competency. However, each of the remaining 9 competencies was covered by only a few classroom training programs, and this implied that classroom training programs focused on the particular data literacy competencies. There were five university libraries that developed and provided their own online tutorials. The analysis of the headings showed that the competencies of data preservation, ethics and data citation, and data management and organization were mainly covered and the difference existed in the competencies stressed by the classroom training programs. For effective RDM training program, it is necessary to understand and support the education of data literacy competencies that researchers need to draw research results, in addition to competencies that university librarians traditionally have taught and emphasized. It is also needed to develop educational resources that support continuing education for the librarians involved in RDM services.

김지현(이화여자대학교) ; 정은경(이화여자대학교) ; 윤정원(University of South Florida) ; 이재윤(명지대학교) 2017, Vol.34, No.1, pp.7-29 https://doi.org/10.3743/KOSIM.2017.34.1.007

학술 커뮤니티 내에서 논문의 인용은 보편적인 규범으로 자리 잡은 데 비해 데이터의 인용은 아직 초보적인 단계에 머물러 있다. 이를 개선하기 위해 제기되고 있는 데이터 인용의 필요성 및 원칙과 가이드라인에 대해서 살펴보았다. 또한 데이터 인용체계 구축 사례에서는 데이터 인용 요소들을 정의하고 서비스를 제공하는 DataCite, Dataverse Network, Data Citation Index 사례를 중심으로 살펴보았다. 마지막으로 한국종합사회조사 데이터 인용 분석을 통해 국내 데이터세트 인용/이용 정보 제공 실태를 조사하였다.


Data citation remains in its infancy, although providing the citation to a journal article is a typical norm in an academic community. This study examines the need for data citation, its principles and guidelines for improving the issue. In addition, the study investigates cases that established data citation mechanism, including DataCite, Dataverse Network and Data Citation Index that define elements of data citation and provide relevant services. At the end, it explores the current state of data citation in Korea through the analysis of citations to dataset from Korean General Social Survey.


공공데이터의 개방과 제공의 활성화와 함께, 공공도서관이 업무 중에 생산한 서지 데이터와 대출 이력과 같은 데이터가 도서관 공공데이터로 제공되고 있다. 본 논문은 도서관 공공데이터의 품질을 진단하고, 그 결과를 바탕으로 도서관 공공데이터의 품질을 높일 개선방안을 제안하고자 한다. 먼저, 문헌정보학 영역에서 공공데이터에 관해 이루어진 연구를 개괄한다. 그다음으로, 도서관 공공데이터 개방 플랫폼인 도서관 정보나루의 오픈 API를 통해 확보한 도서관 공공데이터의 완전성과 정확성을 진단한다. 마지막으로, 데이터 품질 진단 결과에 바탕을 개선방안을 도출한다. 완전성을 진단한 결과, 도서의 식별과 검색을 위 필수적인 서지 요소에서 다수의 공백이 확인되었다. 정확성을 진단한 결과, 값의 유형, 값의 범위, 제한조건을 따르지 않는 부정확한 서지 요소가 확인되었다. 본 연구는 데이터 품질 진단 분석 결과를 바탕으로, 도서관 정보나루의 데이터 수집 절차 개선, 데이터별 스키마 구축, 데이터 수집과 데이터 처리에 관한 안내 제공, 원자료 공개를 제언하였다.


With the popularization of open government data, Library-related open government data is also open and utilized to the public. The purpose of this paper is to diagnose the quality of library-related open government data and propose improvement measures to enhance the quality based on the diagnosis result. As a result of diagnosing the completeness of the data, a number of blanks are identified in the bibliographic elements essential for identifying and searching a book. As a result of diagnosing the accuracy of the data, the bibliographic elements that are not compliant with the data schema have been identified. Based on the result of data quality diagnosis, this study suggested improving the data collection procedure, establishing data set schema, providing details on data collection and data processing, and publishing raw data.


우리나라는 공공데이터 제공과 관련된 제도가 최근 제정되면서 정부기관 및 지방자치단체 등의 공공기관이 보유한 데이터를 적극적으로 개방하고 제공하는 방향으로 정책이 변화하고 있다. 개방의 목적은 크게 두 가지로 구분한다. 정부운영의 투명성을 확보하여 국민의 알 권리를 충족시키는 것이다. 다른 하나는 공공데이터를 하나의 국가부존 자산으로 활용하여 국익을 창출하기 위함이다. 이 연구에서는 공공데이터의 개방 현황을 분석하고 개선방안을 제시하였다. 연구범위는 지방자치단체에서 제공하는 공공데이터이기 때문에 서울특별시를 비롯한 17개 광역시도와 기초 자치단체 228개 시․군․구에서 보유한 것을 전수 조사하였다. 연구결과에 따르면 지방자치단체는 각 기관에서 생산 및 소장한 공공데이터에 대한 목록파악과 공개에 대해 상대적으로 소극적인 것과 개방 데이터의 포맷도 특정 소프트웨어에 의존적인 형태였다. 이러한 점을 해결하기 위해서는 궁극적으로 지역 공공데이터개방과 활용을 높일 방안으로 링크드 오픈 데이터 형태로 개방하는 필요성과 방안을 제시하였으며, 국가 공공데이터개방을 위한 통합 플랫폼을 통한 종합적 개방절차와 방안을 제안하였다.


In South Korea, systems related to the provision of public data were recently implemented. As a result, policy changes have been made that are headed in the direction of actively providing open access to data held by public institutions, such as government agencies and local municipalities. The purpose of the open I will be divided into two broad. To ensure the transparency of government operations, and is intended to satisfy the right to know the people. The other one is to create national interest by utilizing the public data as one country endowment assets. In this study, we analyze the open situation of public data, were presented the improvement measures. Range of research, the public data that local government owns, to determine to have a central information and other limitations and characteristics, Seoul the beginning to the seventeen regional support municipality 228 that you have held for city districts were census. According to the research results, local governments, themselves produced, is a relatively reluctant to disclosure and understanding of the list of public data that are holdings. According to the research results, local governments, themselves produced, is a relatively reluctant to disclosure and understanding of the list of public data that are holdings, also emphasizes the conservative value than take advantage of value have had. Therefore, it was determined that there is a need to resolve several issues through disclosure via a linked data format as a strategy to increase the openness and utilization of local public data.


본 연구에서는 서지 정보를 확장하기 위한 방안으로 링크드 데이터를 선정하였다. 링크드 데이터는 웹 공간을 통해 공유 가능한 식별기호와 데이터 구조 및 링크 정보를 제공하기 때문이다. 특히 링크드 데이터는 서지 온톨로지와 결합하여 서지데이터를 확장시키는데 유용하다. 이에 링크드 데이터와 서지 온톨로지를 분석하고, 연계 가능한 링크드 데이터를 검토하였다. 그리고 이를 바탕으로 링크드 데이터로 구축된 기존의 전거 데이터 및 서지 데이터를 연계하였다. 이러한 실험적 연계를 통해 향후 링크드 데이터를 효과적으로 활용하기 위한 과제를 도출할 수 있었다. 즉, 1) 다양한 링크드 데이터 중에서 각 기관에서 적합한 데이터를 선정할 수 있어야 하며, 2) 선정된 링크드 데이터를 연계하기 위한 기준을 정립해야 하고, 마지막으로 3) 자관의 고유한 데이터를 개발하여 이를 다시 공유해 나가야 할 것을 제안하였다.


In this study, Linked Data was used for extending bibliographic data, because Linked Data provides shareable identifiers, data structures, and link information. Linked Data is especially efficient in expanding bibliographic data integrated with bibliographic ontology. Therefore, Linked Data and bibliographic ontologies were analyzed and available Linked Data was suggested. By linking between meta-data schemes, bibliographic data, and authority data, issues for the effective Linked Data sharing were suggested: 1) selecting proper Linked Data for each bibliographic organization, 2) linking between different Linked Data, and 3) developing their own Linked Data for each bibliographic organization.

박성은(한국과학기술정보연구원 연구데이터공유센터 선임기술원) ; 이미경(한국과학기술정보연구원 연구데이터공유센터 책임연구원) ; 조민희(한국과학기술정보연구원 연구데이터공유센터 책임연구원) ; 송사광(한국과학기술정보연구원 연구데이터공유센터 책임연구원, UST 응용AI학과 교수) ; 김다솔(한국과학기술정보연구원 연구데이터공유센터 기술원) ; 임형준(한국과학기술정보연구원 연구데이터공유센터 센터장) 2024, Vol.41, No.1, pp.465-486 https://doi.org/10.3743/KOSIM.2024.41.1.465

본 연구는 한국과학기술정보연구원(KISTI)에서 개발하고 있는 국가연구데이터커먼즈(KRDC)를 실제 이용할 국가과학기술연구회(NST) 산하 정부출연연구기관의 연구데이터 관리자를 대상으로 연구데이터를 분석하기 위한 인프라와 서비스의 현황을 파악하고, KRDC 체계 구축과 관련한 연구데이터 관리자들의 인식을 조사하는 것을 목적으로 하였다. 이를 위해 KISTI를 제외한 24개의 정부출연연구기관을 대상으로 설문을 실시하였으며, 설문조사에 응답한 15개 기관 중 후속 인터뷰에 동의한 9개 기관의 연구데이터 관리자를 대상으로 인터뷰를 수행하였다. 설문 결과, 대부분의 기관들이 관련 서비스를 제공하고 있었으며, 연구데이터 활용을 위한 통합 분석 프레임워크의 도입과 외부에 공개된 분석 SW를 사용할 수 있는 체제에 대한 제공 의향 역시 높은 것으로 나타났다. 한편 후속 인터뷰를 통해 각 기관별로 제공하는 분석 서비스의 외부 공개 현황을 파악해보았을 때, 매우 소수의 기관만이 이를 외부에 공개하고 있었다. 이러한 연구 결과를 분석해보면, 프레임워크를 통해 분석 인프라와 서비스가 제공될 경우 활용하고자 하는 수요가 있으나, 각 기관에서 보유하고 있는 분석 자원을 공개 및 공유하기 어렵다는 것을 알 수 있다. KRDC 체계 구축을 위해서는 연구 현장에서의 분석 인프라와 분석 서비스의 공유가 필수적인 만큼 연구 현장에서의 인식 전환, 나아가 제도적 변화가 필요하며, 후속 인터뷰에서 제시된 시스템의 편리성, 보안, 보상체계 등을 잘 고려하는 정책을 수립하기 위해 노력할 필요가 있다.


The purpose of this study is to identify the current status of infrastructure and services for analyzing research data for research data managers at government-funded research institutions under the National Research Council for Science and Technology (NST) who will actually use the Korea Research Data Commons (KRDC), which is being developed by the Korea Institute of Science and Technology Information (KISTI) and to investigate the perceptions of research data managers related to the establishment of KRDC system. For the study, we conducted a survey targeting 24 government-funded research institutes, excluding KISTI, and interviewed research data managers from 9 of the 15 institutions surveyed who agreed to follow-up interviews. As a result of the survey, most institutions were providing related services, and their willingness to introduce an integrated analysis framework for the use of research data and provide a system for using externally released analysis software was also high. Meanwhile, when we investigated the external disclosure status of each institution’s analysis services through follow-up interviews, only a minimal number of institutions were disclosing them to the outside world. The findings reveal that there is a demand to utilize analysis infrastructure and services when provided through the framework. However, it is difficult to disclose and share the analysis resources held by each organization. In order to establish the KRDC system, it is essential to share research sites’ analysis infrastructure and services, and in addition, changes in the perception of research sites and institutional changes are necessary. Furthermore, there is a need to establish policies that consider the system’s convenience, security, and compensation system raised in the follow-up interviews.

한나은(한국과학기술정보연구원) 2023, Vol.40, No.1, pp.51-71 https://doi.org/10.3743/KOSIM.2023.40.1.051

본 연구는 공공데이터 품질관리 모델, 빅데이터 품질관리 모델, 그리고 연구데이터 관리를 위한 데이터 생애주기 모델을 분석하여 각 품질관리 모델에서 공통적으로 나타나는 구성 요인을 분석하였다. 품질관리 모델은 품질관리를 수행하는 객체인 대상 데이터의 특성에 따라 생애주기에 맞추어 혹은 PDCA 모델을 바탕으로 구축되고 제안되는데 공통적으로 계획, 수집 및 구축, 운영 및 활용, 보존 및 폐기의 구성요소가 포함된다. 이를 바탕으로 본 연구는 연구데이터를 대상으로 한 품질관리 프로세스 모델을 제안하였는데, 특히 연구데이터를 대상 데이터로 하여 서비스를 제공하는 연구데이터 서비스 플랫폼에서 데이터를 수집하여 서비스하는 일련의 과정에서 수행해야하는 품질관리에 대해 계획, 구축 및 운영, 활용단계로 나누어 논의하였다. 본 연구는 연구데이터 품질관리 수행 방안을 위한 지식 기반을 제공하는데 의의를 갖는다.


This study analyzed the government data quality management model, big data quality management model, and data lifecycle model for research data management, and analyzed the components common to each data quality management model. Those data quality management models are designed and proposed according to the lifecycle or based on the PDCA model according to the characteristics of target data, which is the object that performs quality management. And commonly, the components of planning, collection and construction, operation and utilization, and preservation and disposal are included. Based on this, the study proposed a process model for research data quality management, in particular, the research data quality management to be performed in a series of processes from collecting to servicing on a research data platform that provides services using research data as target data was discussed in the stages of planning, construction and operation, and utilization. This study has significance in providing knowledge based for research data quality management implementation methods.


본 연구에서 제안하는 기법은 최대 개념강도 인지기법(Maximal Concept-Strength Recognition Method: MCR)이다. 신규 데이터베이스가 입수되어 자동분류가 필요한 경우에, 기 구축된 여러 데이터베이스 중에서 최적의 데이터베이스가 어떤 것인지 알 수 없는 상태에서 MCR 기법은 가장 유사한 데이터베이스를 선택할 수 있는 방법을 제공한다. 실험을 위해 서로 다른 4개의 학술 데이터베이스 환경을 구성하고 MCR 기법을 이용하여 최고의 성능값을 측정하였다. 실험 결과, MCR을 이용하여 최적의 데이터베이스를 정확히 선택할 수 있었으며 MCR을 이용한 자동분류 정확률도 최고치에 근접하는 결과를 보여주었다.


The proposed method in this study is the Maximal Concept-Strength Recognition Method(MCR). In case that we don't know which database is the most suitable for automatic-classification when new database is imported, MCR method can support to select the most similar database among many databases in the legacy system. For experiments, we constructed four heterogeneous scholarly databases and measured the best performance with MCR method. In result, we retrieved the exact database expected and the precision value of MCR based automatic-classification was close to the best performance.
