
본문 바로가기 주메뉴 바로가기

ACOMS+ 및 학술지 리포지터리 설명회

  • 한국과학기술정보연구원(KISTI) 서울분원 대회의실(별관 3층)
  • 2024년 07월 03일(수) 13:30


검색어: 데이터 제공자, 검색결과: 93
최형욱(이화여자대학교 일반대학원 문헌정보학과) ; 정은경(이화여자대학교) 2017, Vol.34, No.3, pp.109-124 https://doi.org/10.3743/KOSIM.2017.34.3.109

여러 학문 분야에서 데이터의 공유와 재이용에 관한 관심이 증가하고 있다. 실제로 다른 연구자의 데이터를 다시 연구에 사용하고 인용을 부여하는 관행이 서서히 자리를 잡아가고 있다. 이러한 변화를 반영하여 톰슨로이터는 Data Citation Index(DCI)라는 데이터인용 색인 데이터베이스 서비스를 2012년부터 제공하기 시작하였다. DCI는 모든 학문의 전 영역에서 데이터의 인용 현황을 저널의 논문과 유사하게 집계한다. 본 연구에서는 데이터인용이 활발한 사회학 분야의 인용된 연구데이터를 분석하여 해당 분야의 특성과 지적구조를 규명하고자 하였다. 이를 위해 논문 인용을 기반으로 한 사회학 분야의 지적구조와 비교하였으며, 사회학 분야의 연구데이터의 특성과 고유한 지적구조를 살펴보고자 하였다. 분석을 위한 데이터는 두 종류로 수집하였다. 첫째는 DCI에서 ‘Sociology’로 주제 검색을 수행하여 총 8,365건의 인용된 데이터를 수집하였다. 둘째로, 논문 인용 분석과의 비교를 위해서 Web of Science에서 ‘Sociology’로 주제 검색을 수행하여 총 12,132건의 데이터를 수집하였다. 이 두 데이터를 활용하여 저자키워드 동시출현단어 분석을 수행한 결과, 데이터를 기반으로 한 사회학 분야는 2영역 15군집으로 구성된 반면, 논문을 기반으로 한 사회학 분야는 3영역 17군집으로 나타났다. 내용적인 특성을 살펴보면, 전통적으로 사회학의 지적구조를 나타낸다고 볼 수 있는 논문 기반 사회학과 달리 사회학 분야의 연구데이터는 의학 분야와의 활발한 접목을 찾아볼 수 있으며, 그 중에서도 공중보건과 심리학이 중심 영역인 것으로 나타났다.


Through a wide variety of disciplines, practices on data access and re-use have been increased recently. In fact, there has been an emerging phenomenon that researchers tend to use the data sets produced by other researchers and give scholarly credit as citation. With respect to this practice, in 2012, Thomson Reuters launched Data Citation Index (DCI). With the DCI, citation to research data published by researchers are collected and analyzed in a similar way for citation to journal articles. The purpose of this study is to identify the characteristics and intellectual structure of sociology field based on research data, which is one of actively data-citing fields. To accomplish this purpose, two data sets were collected and analyzed. First, from DCI, a total of 8,365 data were collected in the field of sociology. Second, a total of 12,132 data were collected from Web of Science with a topic search with ‘Sociology’. As a result of the co-word analysis of author provided-keywords for both data sets, the intellectual structure of research data-based sociology was composed of two areas and 15 clusters and that of article-based sociology was composed with three areas and 17 clusters. More importantly, medical science area was found to be actively studied in research data-based sociology and public health and psychology are identified to be central areas from data citation.

임정훈(대전과학고등학교 교사) ; 조창제(NeuroEars 연구개발전담부서) ; 김종헌(대전과학고등학교 교사) 2022, Vol.39, No.3, pp.1-22 https://doi.org/10.3743/KOSIM.2022.39.3.001

본 연구는 학교도서관에서 활용할 수 있는 도서추천시스템을 제안하는데 목적이 있다. 도서추천시스템은 DLS의 대출 데이터를 활용하여 연관규칙 기반의 알고리즘을 적용하였으며, 학교도서관 이용자들에게 개인화 도서추천 서비스 제공이 가능하도록 설계하였다. 이를 위해 Apriori 알고리즘 기반의 연관규칙과 매개 중심성 분석을 적용하고, 기술통계, 연관규칙 생성, 학생중심 추천, 도서 중심추천 등 세부 기능을 구현하였다. 이어서 사서교사를 대상으로 심층면담을 통해 도서추천시스템 사용에 대한 의견을 조사하였다. 조사 결과, 도서추천의 필요성 및 어려움, 학생의 반응, 기존 추천방식과의 차이점 및 활용방안, 개선 사항에 대한 의견을 확인할 수 있었으며, 이를 토대로 다음의 논의점을 제안하였다. 첫째, 개별학교의 특성을 파악하기 위해서 장기간의 대출 데이터의 제공이 필요하다. 둘째, 지역별 혹은 학교 특성별 데이터 통합 방안에 대한 논의가 필요하다. 셋째, 독서교육종합시스템에서 제공하는 도서추천시스템의 구축이 필요하다. 본 연구에서 제안된 내용을 토대로 향후 학교도서관 현장에서 활용할 수 있는 개인화 추천시스템 적용에 대한 다양한 논의가 이루어지길 기대한다.


The purpose of this study is to propose a book recommendation system that can be used in school libraries. The book recommendation system applies an algorithm based on association rules using DLS lending data and is designed to provide personalized book recommendation services to school library users. For this purpose, association rules based on the Apriori algorithm and betweenness centrality analysis were applied and detailed functions such as descriptive statistics, generation of association rules, student-centered recommendation, and book-centered recommendation were materialized. Subsequently, opinions on the use of the book recommendation system were investigated through in-depth interviews with teacher librarians. As a result of the investigation, opinions on the necessity and difficulty of book recommendation, student responses, differences from existing recommendation methods, utilization methods, and improvements were confirmed and based on this, the following discussions were proposed. First, it is necessary to provide long-term lending data to understand the characteristics of each school. Second, it is necessary to discuss the data integration plan by region or school characteristics. Third, It is necessary to establish a book recommendation system provided by the Comprehensive Support System for Reading Education. Based on the contents proposed in this study, it is expected that various discussions will be made on the application of a personalization recommendation system that can be used in the school library in the future.

심원식(성균관대학교 문헌정보학과 교수) 2019, Vol.36, No.4, pp.227-251 https://doi.org/10.3743/KOSIM.2019.36.4.227

최근 우리나라에서도 관련 법개정을 통해 해외 국가의 연구비 지원기관 등에서 시행하고 있는 데이터관리계획 정책이 도입되었다. 본 연구는 앞으로 연구데이터의 공유 및 재사용을 지원할 수 있는 인프라와 지원 서비스를 개발함에 있어 참고가 될 수 있는 호주의 사례를 분석하여 시사점을 도출하고자 하였다. 이를 위해 호주의 연구비 지원기관, 연구데이터 전담기관, 대학도서관의 다양한 전문가와의 면담을 시행하고 관련 문헌을 조사하였다. 호주의 경우 연방 차원에서 2015년 제정된 Public Data Policy에 연구데이터를 공공데이터 범위에 포함시키고, 연구비 지원기관의 정책 가이드라인에 연구데이터의 체계적인 관리와 공유를 권장하고 있지만 의무규정은 아니다. 연구데이터 전담기관인 Australian National Data Service(ANDS)는 국가의 연구인프라 구축의 중요한 부분이며 연구데이터 인프라의 구축, 교육, 정책 지원, 소규모 연구개발사업 지원 등의 다양한 역할을 수행하고 있다. 호주 대학도서관은 연구데이터 관련 일부 자체 시스템을 제공하고 있으나 아직까지는 연구데이터와 관련된 주요한 수요는 없는 것으로 보인다. 호주 사례의 시사점으로는 연구데이터 관련 정책 수립에 있어서 높은 투명성과 예측가능성, 연구데이터 전담 기관 설립을 통한 전문적 인프라 구축 및 교육/홍보 기능 수행, 대학도서관의 데이터 역량 개발을 들 수 있다.


In early 2019, Korea passed the law that introduced data management plan policy similar to those adopted by national funding agencies in other countries. In anticipation of developing research data infrastructure and support services, this study analyzed Australia’s relevant policies and policy instruments. A number of face-to-face interviews with the experts at the national funding agency, a national research data agency and a number of research libraries, along with focused literature analysis. In Australia, the 2015 Public Data Policy is applied to research data from publicly funded research. Research data management and sharing is recommended but not required by the national funding agency it its policy documents. Australian National Data Service(ANDS), Australia’s national research data agency, is an important component of the national research infrastructure. ANDS plays a wide range of roles including research data platform development, education and training, policy support, and funding agency for small-scale R&D. Some of the Australian research libraries have developed in-house systems for research data storage and publishing. However, there is no significant demand for research data service as yet. Lessons learned include the following: ensuring transparency and predictability of research data policies, establishing a dedicated agency responsible for research data platform development and training, and cultivating data capabilities at research libraries.

김현희(명지대학교) ; 구내영(한국경제연구원) 2002, Vol.19, No.2, pp.131-158 https://doi.org/10.3743/KOSIM.2002.19.2.131

본 연구의 목적은 이용자 연구와 국내외 기존 시스템의 기능을 분석한 자료를 기반으로 하여 맞춤정보서비스를 제공하는 MyCyberLibrary의 모형을 설계한 후 이를 평가하여 좀 더 효율적인 정보서비스를 제공하기 위한 기초 자료를 제공하는 것이다. MyCyberLibrary 모형은 최신정보제공서비스, 전자저널/e-book 관리, 데이터베이스 관리. 컬렉션 관리, 프로젝트 관리, 전자지정자료 관리, 도서관 정보서비스 관리, 파일통합 관리, 저작권 관리의 총 9개 서브시스템들로 구성된다. 또한 모형의 효율성을 측정하기 위해서 프로토타입 시스템을 구성하여 40명의 이용자를 대상으로 시스템의 만족도를 조사하고 시스템의 기능을 향상시키기 위한 세 가지 방안을 제안하였다.


The purpose of this study is to suggest the basic data for providing library information services of high quality with clients, by designing the model of MyCyberLibrary and evaluating it. The model of MyCyberLibrary was constructed based on the survey results on the information-seeking behavior of users and on the review of the existing mylibraries′functions. The model is implemented into the prototype system which consists of nine modules. Finally, we evaluated the proposed system via mail questionnaires, and proposed three suggestions to make this system a much more comprehensive and effective one.

한희정(전북대학교 문화융복합아카이빙 연구소 전임연구원) ; 윤성호(전북대학교 일반대학원 기록관리학과 석사과정) ; 오효정(전북대학교 문헌정보학과 부교수) ; 양동민(전북대학교 일반대학원 기록관리학과 부교수) 2020, Vol.37, No.2, pp.251-284 https://doi.org/10.3743/KOSIM.2020.37.2.251

정보의 활용이 국가 경쟁력의 핵심으로 부각되면서 우리 정부를 포함한 주요 선진국들은 데이터를 중요하게 인식하고 있으며, 이에 따라 장기보존 기술 연구 및 표준 제정 등을 추진하여 데이터의 체계적인 관리 및 보존을 위한 노력을 지속적으로 기울이고 있다. 그러나 현재 국내의 경우 다양한 유형의 데이터들에 대해 법령에는 기록관리 대상으로 명시하고 있지만, 이를 수집, 관리 및 보존하기 위한 구체적인 방법은 표준전자문서 이외에는 없는 상황이다. 특히, 행정정보시스템에서 생산되는 엄청난 규모의 데이터세트에 대한 관리 및 보존은 무엇보다 강하게 요구되어 왔으나 데이터세트에 대한 지침이 제대로 제공되고 있지 않고 있다. 보존포맷 선정체계가 마련되어야 시스템 보완 및 구축이 가능하기 때문에 우선적으로 데이터세트 특성을 고려한 보존포맷 선정 기준 체계가 보다 구체화 되어야 하며, 선정기준에 따라 도출된 데이터세트 보존포맷의 변환에 대한 실증적인 검증 작업이 필요하다. 이에 본 연구는 데이터세트의 특성을 고려한 보존포맷 선정 기준에 대한 평가체계를 도출하고, 보존포맷에 대한 실증적 검증을 통해 장기보존할 수 있는 방안을 제시하고자 한다.


As the use of information has emerged as the core of national competitiveness, major developed countries and the Korean government have realized the importance of data. They have pursued technical research and standard establishment for long-term preservation and continuously strived for systematic management and preservation of data. However, although various types of data are specified for the purpose of record management in the law, there is no specific method on how to collect, manage and preserve them, except standard electronic documents. In particular, management and preservation of huge datasets from the administrative information system have been strongly demanded above all. Any guidelines for datasets do not have been properly provided. After the framework for selecting preservation format must be prepared, the system can be supplemented and built. The framework considering the characteristics of the dataset should be specified more concretely, and empirical verification of the conversion and restoration for the dataset preservation format derived according to the selection criteria is necessary. Therefore, this study intends to propose a method for long-term preservation through empirical verification of the preservation format after deriving an evaluation the framework for the preservation format selection criteria considering the characteristics of the dataset.


본 연구는 인쇄형 해외학술지 원문제공서비스(DDS)의 경제성을 분석하기 위해 이용자 기반의 경제적 가치 평가 방법론 및 모델을 개발하고자 하였다. 본 연구를 위해 K기관의 구독중인 해외학술지 원문제공서비스의 데이터 중 일부가 분석을 위해 사용되었고 K기관 원문제공서비스 이용자를 대상으로 웹 서베이를 실시하였다. 해외학술지 원문제공서비스의 경제적 가치는 사용가치, 비사용가치, 그리고 기대가치가 고려되었고 사용가치 산출을 위해서는 소득접근법과 시장접근법을 제안하였다. 이용자에 의한 가치 산출을 위해, 본 연구는 조건부가치평가법을 적용하였고 이를 위해 가상 시나리오를 설정하였다.


This study is to develope a user-based economic valuation methodology and model for the economic analysis on the DDS of foreign journals. For this study, the sampling data on the annual subscribed journals by K institution was used and the online questionnaire was used to collect data. There are three aspects of the economic value of DDS journals was classified as use value, non-use value, and expectancy value. We suggested the income and market approach to measure its economic use value. To estimate the its value by individual users, this study applied a contingent valuation method and designed the imaginary scenarios.

노영희(건국대학교) ; 오의경(상명대학교) ; 정대근(전남대학교 문헌정보학과) 2018, Vol.35, No.2, pp.7-36 https://doi.org/10.3743/KOSIM.2018.35.2.007

본 연구는 기초학문자료센터가 인문자산 원스톱(One-Stop) 포털 서비스 구축에 있어 효과적인 데이터연계 방향성 제안을 목적으로 하였다. 이를 위해 인문자산을 보유한 국내 기관에 대한 현황을 수집하고 분석하였으며, 대상 기관이 보유한 데이터 분석을 통해 연계 방향성을 제시하였다. 본 연구에서는 첫째, 인문자산의 주제에 대하여 기존 분류체계 검토를 기반으로 인문자산의 분류체계를 제안하였다. 둘째, 조사 대상기관이 보유하고 있는 데이터의 주제와 유형에 대한 구체적인 분석을 통해 인문자산으로 편입될 수 있는 잠재적 데이터의 범주를 설정하였다. 셋째, 인문자산 원스톱 포털 서비스를 제공하고 있는 유사사례 기관의 플랫폼을 분석하였으며, 유사성을 중심으로 원스톱 시스템 구축 시, 적용 가능한 메타필드를 제시하였다.


The purpose of this study is to propose an effective direction of data linkage for building the humanities assets one-stop portal service. For this purpose, We collected and analyzed the actual status of the domestic institution with humanities assets, and presented the linkage direction through analysis of the data held by the target organization. The results of this study are as follows: First, we proposed a classification system of humanities assets based on the reviewing the existing classification system on the subject of humanities assets. Second, we set up the categories of potential data that can be incorporated into humanities assets through a detailed analysis of the subject and type of data held by the subject institutions. Third, we analyzed the platforms of similar case organizations providing one-stop portal services for humanities assets and proposed the applicable meta fields when constructing one-stop system based on similarity.


한국어 및 영어의 글쓰기를 도와주는 문장 및 문단 제공시스템을 구축하기 위하여 색인작성과 탐색시에 필요한 색인언어를 연구하였다. 색인언어로 명사어와 술어 및 부사어를 선정하였고 여러 가지 보조 색인기호들도 추가하였다. 접근점으로 주제명과 키워드를 사용하였고 키워드 검색은 1절, 2절, 3 절, 문맥첨가 탐색을 포함하였다. 검색의 만족도는 긍정적이었으며 데이터베이스의 양과 질을 충실히 보완한다면 문장이나 문단을 제공하여 주는 시스템은 효과적일 수 있다.


An indexing language were studied to construct the sentences and paragraphs providing system aided to write a Korean or English composition. The indexing language includes the index terms like noun, predicate, and adverb. and also various index symbols. The subject name and the keyword Included the symbols, which Indicate the connectives between clauses in a sentence, is used as the access point. The search results show this system will be effective with large database and developed retrieval methods.

한나은(한국과학기술정보연구원) ; 서수정(한국과학기술정보연구원) ; 엄정호(한국과학기술정보연구원) 2023, Vol.40, No.3, pp.77-98 https://doi.org/10.3743/KOSIM.2023.40.3.077

본 연구는 지금까지 제안된 거대언어모델 가운데 LLaMA 및 LLaMA 기반 모델과 같이 연구데이터를 주요 사전학습데이터로 활용한 모델의 데이터 품질에 중점을 두어 현재의 평가 기준을 분석하고 연구데이터의 관점에서 품질 평가 기준을 제안하였다. 이를 위해 데이터 품질 평가 요인 중 유효성, 기능성, 신뢰성을 중심으로 품질 평가를 논의하였으며, 거대언어모델의 특성 및 한계점을 이해하기 위해 LLaMA, Alpaca, Vicuna, ChatGPT 모델을 비교하였다. 현재 광범위하게 활용되는 거대언어모델의 평가 기준을 분석하기 위해 Holistic Evaluation for Language Models를 중심으로 평가 기준을 살펴본 후 한계점을 논의하였다. 이를 바탕으로 본 연구는 연구데이터를 주요 사전학습데이터로 활용한 거대언어모델을 대상으로 한 품질 평가 기준을 제시하고 추후 개발 방향을 논의하였으며, 이는 거대언어모델의 발전 방향을 위한 지식 기반을 제공하는데 의의를 갖는다.


Large Language Models (LLMs) are becoming the major trend in the natural language processing field. These models were built based on research data, but information such as types, limitations, and risks of using research data are unknown. This research would present how to analyze and evaluate the LLMs that were built with research data: LLaMA or LLaMA base models such as Alpaca of Stanford, Vicuna of the large model systems organization, and ChatGPT from OpenAI from the perspective of research data. This quality evaluation focuses on the validity, functionality, and reliability of Data Quality Management (DQM). Furthermore, we adopted the Holistic Evaluation of Language Models (HELM) to understand its evaluation criteria and then discussed its limitations. This study presents quality evaluation criteria for LLMs using research data and future development directions.


본 연구는 대용량 음악콘텐츠환경에서 개인화 추천 서비스를 위한 기반구조의 제공을 위하여 시도되었다. 추천서비스를 위한 기존의 많은 연구와 상용프로그램에도 불구하고 대규모의 쇼핑몰들은 개인화 추천서비스와 실시간으로 대용량의 데이터를 처리할 수 있는 추천시스템을 필요로 하고 있다. 이를 위하여 본 연구에서는 데이터마이닝 기술과 새로은 패턴매칭 알고리즘을 제안하고 있다. 콘텐츠 주제분야에 대한 이용자의 선호도를 이용한 이용자 분할을 위하여 군집화 기법이 사용되었다. 다음으로는 군집화를 통하여 생성된 분할된 이용자 그룹에서 개별 이용자의 콘텐츠에 대한 접근 패턴의 추출을 위하여 순차패턴 마이닝기법을 적용하였다. 최종적으로 각각의 이용자 군집의 콘텐츠 접근 패턴과 콘텐츠 선호도에 기반한 제안된 추천 알고리즘에 의해 추천이 이루어진다. 이러한 추천을 위하여 기반구조와 함께, 전처리과정과 원본 데이터의 형식변환이 데이터베이스에서 수행되어진다. 본 연구에서 제안하고 있는 기반구조의 적절성을 보여주기 위하여 제안된 시스템을 구현하였다. 실제 이용자에 의해 이용된 데이터를 실험에 적용하였으며, 해당 실험에서 추천은 실시간으로 이루어졌으며 추천결과에 있어서는 적절한 정확성을 보여주고 있다.


This study attempts to give a personalized recommendation framework in large-sized music contents environment. Despite of many existing studies and commercial solutions for a recommendation service, large online shopping malls are still looking for a recommendation system that can serve personalized recommendation and handle large data in real-time.This research utilizes data mining technologies and new pattern matching algorithm. A clustering technique is used to get dynamic user segmentations using user preference to contents categories. Then a sequential pattern mining technique is used to extract contents access patterns in the user segmentations. Finally, the recommendation is given by our recommendation algorithm using user contents preference history and contents access patterns of the segment. In the framework, preprocessing and data transformation and transition are implemented on DBMS. The proposed system is implemented to show that the framework is feasible. In the experiment using real-world large data, personalized recommendation is given in almost real-time and shows acceptable correctness.
