
본문 바로가기 주메뉴 바로가기

ACOMS+ 및 학술지 리포지터리 설명회

  • 한국과학기술정보연구원(KISTI) 서울분원 대회의실(별관 3층)
  • 2024년 07월 03일(수) 13:30


검색어: 연구 데이터, 검색결과: 8
박성은(성균관대학교 문헌정보학과 박사과정) ; 고영만(성균관대학교 문헌정보학과) 2022, Vol.39, No.2, pp.159-202 https://doi.org/10.3743/KOSIM.2022.39.2.159

‘국가 연구데이터플랫폼’과 ‘바이오 연구데이터플랫폼’은 비교적 최근 구축되어 활발하게 각각의 생태계를 만들어 가고 있다. 따라서 다른 메타데이터 표준을 기반으로 독립적으로 구축되어 향후 상호운용성의 문제가 발생할 수 있다. 본 연구의 목적은 각 플랫폼의 메타데이터 요소를 매핑하고, 이를 검증하여 상호운용성을 확보하기 위한 기반을 제안하는 것이다. 이를 위해 각 플랫폼의 메타데이터 표준을 분석하고 크로스워크 대상을 선정하여 매핑한 후, 바이오 분야 전문가를 통해 매핑된 요소의 적합성을 검증하고 더 적절한 매핑 요소를 추천받아 데이터셋 및 파일에 대한 메타데이터 요소를 도출하였다. 이를 통해 각 플랫폼의 메타데이터가 의미적으로 연결될 수 있는 가능성과 상호운용성 확보를 위한 기반을 확인할 수 있었다.


The ‘National Research Data Platform’ and the ‘Bio Research Data Platform’ were recently built and each is actively creating an ecosystem. It is built independently based on other metadata standards, which may cause future interoperability issues. The purpose of this study is to propose a basis for metadata interoperability between the two platforms. To this end, the metadata standards of each platform were analyzed, crosswork targets were selected and mapped, and the suitability of the mapped elements was verified through experts in the bio field. And more appropriate mapping elements were recommended to derive metadata elements for datasets and files. Through this, it was possible to confirm the possibility that the metadata of each platform could be semantically linked and the basis for securing interoperability.

박진호(주식회사 리스트 사업개발본부장) ; 고영만(성균관대학교 문과대학 문헌정보학과 교수) ; 김현수(성균관대학교 정보관리연구소 연구원) 2019, Vol.36, No.4, pp.129-159 https://doi.org/10.3743/kosim.pub.36.4.129001

본 연구의 목적은 연구데이터 서비스 자체의 유용성과 연구데이터에 대한 사용경험 기반의 유용성 측면에서 평가 모형을 개발하는 것이다. 다양한 사례에서 도출한 데이터 서비스의 유용성 평가 요소로부터 연구데이터에 내재된 평가척도인 검색성, 접근성, 상호운용성, 재활용성 4개와 각각의 측정지표 총 20개를 도출하였다. 그리고 Google Analytics, YouTube 광고료 책정 기준, 서울특별시, Altmetrics의 사례를 분석하여 연구데이터에 대한 이용자 경험 기반의 유용성 측정지표 12개를 도출하였다. 평가척도와 측정지표에 대한 타당성과 신뢰성 검정을 위해 연구데이터의 잠재적 이용자 164명을 대상으로 설문조사를 실시하였다. 평가척도의 타당성 검정을 위해 KMO Bartlett 분석을 하였으며, 측정지표의 성분분석을 위해 주성분 분석과 베리맥스 회전분석법을 사용하였다. 내재적 평가척도의 경우 4개 척도 모두 KMO Bartlett의 타당성 값을 충족시켰으며, 평가척도에 대한 측정지표의 성분분석 결과 모두 단일 성분으로 나타나 현재의 척도로 해당 지표에 대한 설명이 가능하였다. 그러나 이용자 경험 기반의 12개 측정지표의 성분분석 결과는 2개 성분으로 나누어지는 것으로 나타나 각각을 활용도와 참여도라는 개념의 2개 평가척도로 구분하였다. Cronbach’s alpha 계수에 의한 신뢰도 측정 결과 6개의 평가척도 모두 0.6 이상의 측정치를 충족시키는 것으로 나타났다.


The Purpose of this study is to develop an evaluation model for usability of research data service from the angles of evaluating usefulness of research data service itself and research data use experience-based usability. First, the various cases of evaluating usability of data services are examined and 4 rating scales and 20 measuring indicators for research data service are derived as a result of comparative analysis. In order to verify validity and reliability of the rating scale and the measuring indicators, the study conducted a survey of 164 potential research data users. KMO Bartlett Analysis was performed for validity test, and Principle Component Analysis and Verimax Rotating Method were used for component analysis on measuring indicators. The result shows that the 4 intrinsic rating scales satisfy the validity criteria of KMO Barlett; A single component was determined from component analysis, which verifies the validity of measuring indicators of the current rating scale. However, the result of 12 user experience-based measuring indicators analysis identified 2 components that are each classified as rating scale of utilization level and that of participation level. Cronbach’s alpha of all 6 rating scales was 0.6 or more for the overall scale.

고영만(성균관대학교) ; 이승준(성균관대학교 정보관리연구소) ; 송민선(성균관대학교 정보관리연구소) 2015, Vol.32, No.2, pp.131-152 https://doi.org/10.3743/KOSIM.2015.32.2.131

본 연구에서는 R2RML 방식과 Non-R2RML 방식을 각각 적용하여 RDB를 RDF 온톨로지로 변환한 결과를 비교하였다. RDB 기반의 구조적학술용어사전 데이터베이스인 STNet의 데이터를 대상으로, 변환이 완료된 데이터의 규모, 튜플당 변환에 걸리는 시간, 그리고 질의 응답 속도를 측정하였다. 변환 규모의 평가 결과 Non-R2RML 방식이 더 많은 수의 변환을 하였으며, 표현의 풍부성과 추론 가능성 정도를 높이는 변환을 수행한 것으로 나타났다. 튜플당 변환 시간의 경우 Non-R2RML 방식이 미세하지만 더 빠른 것으로 나타났으며, 질의 응답 속도는 두 방식 모두 300회 이상의 질의 횟수부터는 안정적인 성능을 보이면서 유사한 형태의 속도를 보였다. 측정에 대한 종합적 검토 결과 데이터의 변형이 빈번하고 새로운 데이터의 추가나 데이터들 간의 연결관계가 지속적으로 변화하는 STNet과 같은 동적인 RDB에는 Non-R2RML 방식이 적절한 것으로 평가되었다.


This study described the results of converting RDB to RDF ontology by each of R2RML method and Non-R2RML method. This study measured the size of the converted data, the conversion time per each tuple, and the response speed to queries. The STNet, a structured terminology dictionary based on RDB, was served as a test bed for converting to RDF ontology. As a result of the converted data size, Non-R2RML method appeared to be superior to R2RML method on the number of converted triples, including its expressive diversity. For the conversion time per each tuple, Non-R2RML was a little bit more faster than R2RML, but, for the response speed to queries, both methods showed similar response speed and stable performance since more than 300 numbers of queries. On comprehensive examination it is evaluated that Non-R2RML is the more appropriate to convert the dynamic RDB system, such as the STNet in which new data are steadily accumulated, data transformation very often occurred, and relationships between data continuously changed.

송민선(성균관대학교 정보관리연구소) ; 고영만(성균관대학교) 2015, Vol.32, No.3, pp.221-236 https://doi.org/10.3743/KOSIM.2015.32.3.221

본 연구의 목적은 한국학 분야 국내 학술지 논문 데이터를 대상으로 계층적 군집 분석을 적용해 한국학 분야의 지식 구조를 구성하는 연구 영역을 분석하는 것이다. 이를 위해 KCI에서 탑재된 한국학 관련 학술지 중 2011년~2013년도 기준 3년치 평균 Impact Factor 값이 0.5 이상이며, 2004년부터 2013년까지의 10년치 누적 논문 데이터를 갖고 있는 14종의 학술지에 수록된 논문 중 한글 저자키워드 데이터가 포함되어 있는 3,800편을 분석하였다. 분석 결과, 중심 연구 분야는 대체로 성리학과 실학 중심의 유교 사상을 기반으로 한 정치와 사회에 관한 연구, 한반도의 분단 체제를 둘러싼 정치 관련 연구, 그리고 일제 강점기에서 근현대의 역사인 것으로 나타났다. 시기적으로는 고대나 현대 시점보다는 조선시대부터 근대 시기까지를 대상으로 하는 연구들이 많은 것으로 나타났다.


The purpose of this study is to analyze the research fields constituting the knowledge structure of the Korean Studies by applying hierarchical clustering method to domestic journal papers in Korean Studies. We analyzed 3,800 papers containing Korean author keyword that were listed in 14 kinds of Korean Studies journals published in 2004-2013, which have average impact factor more than 0.5 in 2011-2013. The results of the analysis show that the central research fields are the subjects related to political & social problems based on Confucian ideas focusing on Neo-Confucianism(Seonglihak) and Realist School of Confucianism(Silhak), to the political situation associated with territorial division of the Korean peninsula, and to the history from the period of japanese colonialism to modern and contemporary. It has been also found that the temporal backgrounds of researches in domestic Korean Studies were related to the modern times and the Joseon Dynasty periods, rather than the time of the ancient and contemporary.

고영만(성균관대학교) ; 서태설(한국과학기술정보연구원) ; 임태훈(한국데이타베이스진흥센터) 2007, Vol.24, No.4, pp.223-238 https://doi.org/10.3743/KOSIM.2007.24.4.223

본 연구에서는 다양한 메타데이터간의 의미적 호환성을 유지하거나 개선하기 위한 기존의 방법론을 분석하고 크로스워크를 이용한 메타데이터간의 의미 호환 가능성과 한계에 대해서 검토한 후 메타데이터간의 의미 호환을 극대화하기 위한 의미적 메타데이터 매핑 프로세스를 제시하였다. 이 프로세스는 대상 메타데이터 스킴 확인, 공통 데이터요소개념(DEC) 발견, 데이터요소개념에 따른 속성 그룹화, 매핑 테이블 작성 등의 네 단계로 구성된다. 국내에서 개발된 단체표준 수준의 두 인력정보 메타데이터를 대상으로 본 연구에서 제안된 프로세스를 적용하여 매핑 테이블 작성 과정을 보였다.


This paper contains an analysis of the methods that have been used to achieve or improve interoperability among metadata and discuss the possibilities and limits of semantic interoperability among metadata using crosswalk. After that a semantic metadata mapping process which is able to maximize the interoperability among metadata is suggested. The methodology consists of four steps such as identifying metadata schema, finding common data element concepts(DECs), grouping attributes by the DECs, and mapping into a table. An experimental application of the process was performed onto two human resource information metadata standards developed in Korea.

송민선(성균관대학교 정보관리연구소) ; 고영만(성균관대학교) ; 이승준(성균관대학교 정보관리연구소) 2016, Vol.33, No.3, pp.155-176 https://doi.org/10.3743/KOSIM.2016.33.3.155

본 연구는 한국학 연구 논문 텍스트의 의미 구조를 기반으로 하는 메타데이터를 적용한 학술정보시스템을 구축하여 기존 유사 시스템과의 비교를 통해, 텍스트 구조 기반 메타데이터의 활용 가능성을 확인해 보고자 하는 것을 목적으로 한다. 이를 위해 한국학술지인용색인(Korea Citation Index, KCI)에서 일정 기준을 충족하는 한국학 분야 연구 논문 데이터를 대상으로 의미 구조 메타데이터 항목을 적용한 시범적 검색 시스템(Korean Studies Metadata Database, KMD)을 구축하였으며, 동일한 검색 키워드를 적용하여 기존의 KCI 시스템과 비교했을 때 어떤 특징과 차이점을 갖는지 비교해 보았다. 연구 결과, KMD 시스템이 KCI에 비해 이용자의 검색 의도에 맞는 결과를 보다 효율적으로 보여주는 것으로 확인되었다. 즉 검색하고자 하는 키워드의 조합이나 조건식이 기존 시스템과 동일하더라도 검색 결과를 통해 최종적으로 연구 진행과 관련해 찾고자 하는 연구 목적, 연구의 대상 데이터나 시공간적 배경 등에 따른 검색 결과를 다양하게 보여줄 수 있는 것으로 나타났다.


This study aims to develope a scholarly metadata information system based on conceptual elements of text structure of Korean studies research articles and to identify the applicability of text structure based metadata as compared with the existing similar system. For the study, we constructed a database(Korean Studies Metadata Database, KMD) with text structure based on metadata of Korean Studies journal articles selected from the Korea Citation Index(KCI). Then we verified differences between KCI system and KMD system through search results using same keywords. As a result, KMD system shows the search results which meet the users’ intention of searching more efficiently in comparison with the KCI system. In other words, even if keyword combinations and conditional expressions of searching execution are same, KMD system can directly present the content of research purposes, research data, and spatial-temporal contexts of research et cetera as search results through the search procedure.

고영만(성균관대학교) ; 서태설(한국과학기술정보연구원) 2005, Vol.22, No.4, pp.97-109 https://doi.org/10.3743/KOSIM.2005.22.4.097

본 연구에서는 정보자원의 메타데이터 작성시 메타데이터 간 의미의 일관성을 유지하기 위한 메타데이터 명명 방법론과 이를 실제 분야에 적용할 수 있는 메타데이터 명명 규칙의 실험적 모형을 제시하였다. 이를 위해 우선적으로 ISO/IEC 11179에서 제시하고 있는 메타데이터 레지스트리 메타모형과 데이터의 기본 속성 및 개념을 논의하였으며, 이러한 논의를 토대로 객체용어(object term)와 속성용어(property term) 및 표현(presentation)에 관한 명명 규칙의 실제 적용 사례를 제시하였다. 객체용어의 생성은 자료유형의 엔터티-관계(E-R) 모형에 근거한 휴리스틱 분석을 통해 이루어졌으며, 속성용어의 명명은 더블린코어의 메타데이터 셋을 기반으로, 표현은 SHOE 1.0 버전을 기반으로 하였다.


To build the consistency among different metadata systems and to increase the interoperability of that systems even among different domains, naming rules and glossaries for the data elements are necessary. This study provides discussion of naming and identification of the data element concept, data element, conceptual domain, value domain, and its meta model. This study also describes example naming conventions based on ontology derived from the combination with object, properties, and representation of data elements. The naming principles and rules described in this study use E-R analysis, DC metadata set, and SHOE 1.0 as an example of the scientific documents. This study would be a guideline to build the naming rules of metadata based on ontology in various domains.

고영만(성균관대학교) ; 조수련(성균관대학교) ; 박지영(성균관대학교) 2013, Vol.30, No.4, pp.111-131 https://doi.org/10.3743/KOSIM.2013.30.4.111

본 연구에서는 ‘학술지의 피인용횟수 순위’를 적용한 tapered h-지수의 변형지표 Kor-hT를 고안하여 제안하였다. Kor-hT의 의미를 평가하기 위하여 Kor-hT 지수 값의 중복률 및 지수 값과 평가요소 사이의 연관성 변화를 다른 학술지 평가지표인 h-지수, tapered h-지수 및 IF와 비교 분석하였다. 지수 값의 중복률 분석은 지표의 변별력을 살펴보기 위한 것이며, 지수 값과 평가요소와의 상관관계 분석은 지표의 평가요소인 피인용횟수 및 논문 수가 지수 값에 각각 어떻게 반영되는지를 알아보기 위한 것이다. 분석을 위해 2008년부터 2010년까지의 한국학술지인용색인(KCI) 3개년 데이터를 사용하였다. 분석 결과 본 연구에서 제안한 Kor-hT가 비교 대상 지표에 비해 지수 값의 중복률이 가장 낮아 높은 변별력을 보였으며, 지수 값과 평가요소와의 상관관계에 있어서도 피인용횟수와 논문 수 모두에서 상관관계가 가장 높은 것으로 나타났다.


This study describes the meaning of and the formula for Kor-hT, which is a modified index built on the tapered h-index by applying ‘the ranking according to the number of citations of journals’. This study evaluated the de-duplication rate of index values of Kor-hT and analyzed the change in the correlation between the index values and evaluation elements using the Korea Citation Index data from 2008 to 2010. Kor-hT is compared with h-index, tapered h-index, and IF. As a result, Kor-hT appeared to be superior to other indexes on de-duplication rate. It is also shown that there is a very strong positive correlation between the evaluation elements, the number of citations and the number of articles of journals, and the index values of Kor-hT.
