
본문 바로가기 주메뉴 바로가기

ACOMS+ 및 학술지 리포지터리 설명회

  • 한국과학기술정보연구원(KISTI) 서울분원 대회의실(별관 3층)
  • 2024년 07월 03일(수) 13:30


검색어: 이용연구, 검색결과: 453
한유경(정보통신정책연구원) ; 최원석(정보통신정책연구원) ; 이민철(카카오엔터프라이즈) 2023, Vol.40, No.2, pp.115-135 https://doi.org/10.3743/KOSIM.2023.40.2.115

본 연구는 단행본, 학술지, 보고서 등 다양한 종류의 발간물로 구성된 연구보고서의 참고문헌 데이터베이스를 효율적으로 구축하기 위한 것으로 딥러닝 언어 모델을 이용하여 참고문헌의 자동추출 성능을 비교 분석하고자 한다. 연구보고서는 학술지와는 다르게 기관마다 양식이 상이하여 참고문헌 자동추출에 어려움이 있다. 본 연구에서는 참고문헌 자동추출에 널리 사용되는 연구인 메타데이터 추출과 더불어 참고문헌과 참고문헌이 아닌 문구가 섞여 있는 환경에서 참고문헌만을 분리해내는 원문 분리 연구를 통해 이 문제를 해결하였다. 자동 추출 모델을 구축하기 위해 특정 연구기관의 연구보고서 내 참고문헌셋, 학술지 유형의 참고문헌셋, 학술지 참고문헌과 비참고문헌 문구를 병합한 데이터셋을 구성했고, 딥러닝 언어 모델인 RoBERTa+CRF와 ChatGPT를 학습시켜 메타데이터 추출과 자료유형 구분 및 원문 분리 성능을 측정하였다. 그 결과 F1-score 기준 메타데이터 추출 최대 95.41%, 자료유형 구분 및 원문 분리 최대 98.91% 성능을 달성하는 등 유의미한 결과를 얻었다. 이를 통해 비참고문헌 문구가 포함된 연구보고서의 참고문헌 추출에 대한 딥러닝 언어 모델과 데이터셋 유형별 참고문헌 구축 방향을 제안하였다.


The purpose of this study is to assess the effectiveness of using deep learning language models to extract references automatically and create a reference database for research reports in an efficient manner. Unlike academic journals, research reports present difficulties in automatically extracting references due to variations in formatting across institutions. In this study, we addressed this issue by introducing the task of separating references from non-reference phrases, in addition to the commonly used metadata extraction task for reference extraction. The study employed datasets that included various types of references, such as those from research reports of a particular institution, academic journals, and a combination of academic journal references and non-reference texts. Two deep learning language models, namely RoBERTa+CRF and ChatGPT, were compared to evaluate their performance in automatic extraction. They were used to extract metadata, categorize data types, and separate original text. The research findings showed that the deep learning language models were highly effective, achieving maximum F1-scores of 95.41% for metadata extraction and 98.91% for categorization of data types and separation of the original text. These results provide valuable insights into the use of deep learning language models and different types of datasets for constructing reference databases for research reports including both reference and non-reference texts.


이 연구는 웹정보원의 지적 구조를 동시링크분석을 이용하여 시기별 변화와 검색엔진별 차이를 중심으로 분석하였다. 지적 구조의 시기별 변화를 분석한 결과, 이차원 지도상에 나타난 웹정보원의 군집과 위치는 6년간의 시간흐름에 따른 지적 구조의 변화를 나타냈다. AltaVista와 MSN Search 검색엔진을 대상으로 지적구조의 차이를 분석한 결과, 웹정보원 지도에 나타난 전체적인 지적 구조는 유사한 양상을 나타냈지만, 몇몇 웹정보원의 경우 소속 군집이 달라지는 경우가 발생했다. 인쇄 정보원에 적용되던 동시인용기법이 웹정보원에 대한 통시적 분석에도 응용될 수 있음을 확인하였다.


This research analyzed changes of the intellectual structure of web information by examining time changes and search engines using the co-links analysis. According to the results, the co-links web information clusters on the two maps appeared to contain changes in the intellectual structure over the two time periods.The intellectual structure that appeared in the information map for AltaVista and MSN Search engines was relatively similar. However, there were also cases where the clusters of some web information was different. The results of the research revealed that the cocitation analysis could be applied simultaneously to diachronous analysis in the web information.


본 연구는 국내에서 서비스되는 대체자료 장서 수준을 진단하고 향후 대체자료 장서개발의 방향성과 목표지향점을 제시하는 데 목적이 있다. 국가대체자료종합목록과 국내 인기도서 및 신간도서 목록을 장서기반 평가방법을 활용하여 비교․분석하였다. 연구결과 첫째, 10년간 인기도서 목록 기준 대체자료 장서 비율은 90.1%이다. ‘언어’, ‘예술’, ‘기술과학’ 주제의 대체자료 장서 비율이 낮은 편이며, 제작 매체별은 ‘텍스트 데이지자료’의 비율이 높았다. 둘째, 국가대체자료종합목록을 기준으로 주제별, 매체별, 제작기관별 공통장서 확보율과 장서고유성 지수를 분석한 결과 대체자료의 소장 장서량이 많은 도서관에서 공통장서와 고유장서의 편향성이 높게 나타났다. 공통장서 확보율이 높은 주제는 문학과 사회과학 순이며, 장서고유성 지수가 높은 주제는 종교, 예술, 언어 순으로 나타났다. 셋째, 최근 3년간 신간도서의 대체자료 장서 비율은 5.09%이며 같은 기간 동안 공공도서관의 평균 도서구입율은 8.83%이다. 신간도서 대비 대체자료 장서 비율의 적정 기준은 존재하지 않으며 시각장애인의 정보격차 해소를 위해 신간도서 대비 대체자료 장서 비율을 공공도서관 도서구입율 수준으로 높일 것을 제언하고자 한다.


The purpose of this study is to diagnose the current status of alternative materials in Korea and to suggest directions and goals for the development of alternative materials. The comprehensive list of national alternative materials and the list of popular and new books were analyzed using the collection evaluation method. Results first the percentage of alternative material collections based on the popular book list for 10 years is 90.1%. The production rate of alternative materials is low in the subjects of ‘Language’, ‘Art’ and ‘Technology and Science’. Most of the service formats were ‘text only daisy’. Second, the CCHR(Common Collection Holding Ratio) and CUI(Collection Uniqueness index) of alternative materials were analyzed using the union catalog. Libraries with a large volume of books have a high proportion of CCHR and CUI. Topics with the highest CCHR are ‘Literature’ and ‘Social Science’. The subjects with the highest collection uniqueness index are ‘religion’, ‘art’, and ‘language’. Third, the replacement ratio of new books for 3 years is 5.09%. During the same period, the average book purchase rate of public libraries was 8.83%. The average book purchase rate in public libraries is 8.83%, and it is necessary to increase the collection rate of alternative materials based on this ratio.


로치오 알고리즘에 기초한 통제어휘 자동색인 또는 텍스트 범주화에서 적용되어 온 여러 성능 요인들을 재검토하였고, 성능 향상을 위한 기본적인 방법을 찾아보았다. 또한, 동등한 조건에서 통제어휘 자동색인을 위한 로치오 알고리즘 기반 방법의 성능을 다른 학습기반 방법들의 성능과 비교하였다. 결과에 따르면, 통제어휘 자동색인을 위한 로치오 기반의 프로파일 방법은 구현의 용이성과 컴퓨터 처리시간 측면의 경제성이라는 기존의 장점을 그대로 유지하면서도, 다른 학습기반 방법들(SVM, VPT, NB)과 거의 동등하거나 더 나은 성능을 보여주었다. 특히, 색인전문가의 색인작업을 지원하는 반-자동 색인의 목적으로는 비교적 높은 수준의 재현율을 유지하면서 학습 데이터의 증가에 따라 정확률이 크게 향상되는 로치오 알고리즘을 이용한 방법을 우선적으로 고려할 수 있을 것이다.


Several performance factors which have applied to the automatic indexing with controlled vocabulary and text categorization based on Rocchio algorithm were examined, and the simple method for performance improvement of them were tried. Also, results of the methods using Rocchio algorithm were compared with those of other learning based methods on the same conditions. As a result, keeping with the strong points which are implementational easiness and computational efficiency, the methods based Rocchio algorithms showed equivalent or better results than other learning based methods(SVM, VPT, NB). Especially, for the semi-automatic indexing(computer-aided indexing), the methods using Rocchio algorithm with a high recall level could be used preferentially.

원종삼(대법원 법원도서관 사서) ; 이지연(연세대학교 문헌정보학과 교수) 2020, Vol.37, No.1, pp.127-151 https://doi.org/10.3743/KOSIM.2020.37.1.127

법률에 대한 최종 해석 권한은 법원에 있다. 법원은 개인과 개인의 분쟁, 개인과 국가 사이의 법률적 다툼에 대하여 최종적인 판단을 내린다. 사건의 당사자나 대리인들은 쟁점사항에 대하여 같은 법조문을 놓고 다른 법률해석을 주장하더라도, 궁극적으로 서로 다른 법률해석은 통일된 방향으로 변화되어야 한다. 주석서의 견해에 대하여 법률가들이 다양한 의견을 나누고 새로운 법령, 판례, 법이론 등을 확인하는 과정을 통해 법률해석에 통일을 이룰 수 있다. 법률가가 재판업무 및 법학연구를 위하여 주석서를 활용하는 과정에서 최신의 법령과 판례, 법이론의 현재와 법률가의 다양한 의견을 추가하여 활용할 수 있는 방안을 제안하였다.


The court has the responsibility to determine the final interpretation of the law. The court hands down final decisions on personal disputes and conflicts between individuals and the state. Legal commentaries will stay true to their intention of providing diverse legal theories and enabling a unified legal interpretation only when law practitioners are allowed to discuss in depth laws, cases, and legal theories within the boundaries set by commentary authors. If law practitioners include the latest laws, cases, and legal theories as well as their opinions to existing commentaries in their judicial roles and legal studies, they will be able to obtain a unified legal interpretation without referring to other legal literature.

이창수(경북대학교) ; 김신영(숭의여자대학) 2003, Vol.20, No.1, pp.231-250 https://doi.org/10.3743/KOSIM.2003.20.1.231

정보기술의 급격한 발전은 이용 가능한 정보량의 급증 뿐 만 아니라 정보의 형태에 있어서도 다양화를 가져왔다. 정보이용능력은 정보를 검색하고, 분석하고 이용하는데 필요한 기술이다. 이는 대학교육의 핵심 목표이자 도서관 교육의 새로운 경향으로 인식되고 있다. 그러나 급증하는 정보이용능력에 관한 관심에도 불구하고, 교육 프로그램이나 교수-사서간의 협력에 관한 논의는 부족한 실정이다. 도서관 교육이 교과과정의 일부가 되기 위해서는 대학구성원간의 긴밀한 협력이 반드시 필요하다. 본 연구는 외국 대학도서관에서 채택하고 있는 정보이용능력 교육 프로그램을 개관하고, 대학구성원간 협력에 있어 성공사례를 분석해보았다. 또한 이를 바탕으로 우리나라 대학에서 정보이용능력 교육의 시행에 필요한 절차의 개요를 제시해보았다


The rapid advances in information technologies have resulted in not only the proliferation of the amount of information available but also the variety of information formats. Information literacy is the set of skills needed to find, retrieve, analyze, and use information. Therefore, information literacy which should be the core goal of the university education has been a new trend of the library instruction. Nevertheless, despite the increasing Interest in the information literacy. there has been little discussion about educational Programs. and there has been little coordination between faculty and librarians on the programs. Under such circumstances, campus-wide teamwork is needed so that the library instruction can become part of the entire learning Processes of university education. This Paper presents an overview of the models adopted by foreign university libraries and also analyses the successful cases of the campus-wide partnership of each model of information literacy programs. Based on these. the outline of the needed procedure for the enforcement of the information literacy in the university of our country is suggested.

이용구(계명대학교) ; 정영미(연세대학교) 2007, Vol.24, No.1, pp.321-342 https://doi.org/10.3743/KOSIM.2007.24.1.321

이 연구에서는 수작업 태깅없이 기계가독형 사전을 이용하여 자동으로 의미를 태깅한 후 학습데이터로 구축한 분류기에 대해 의미를 분류하는 단어 중의성 해소 모형을 제시하였다. 자동 태깅을 위해 사전 추출 정보 기반 방법과 연어 공기 기반 방법을 적용하였다. 실험 결과, 자동 태깅에서는 복수 자질 축소를 적용한 사전 추출 정보 기반 방법이 70.06%의 태깅 정확도를 보여 연어 공기 기반 방법의 56.33% 보다 24.37% 향상된 성능을 가져왔다. 사전 추출 정보 기반 방법을 이용한 분류기의 분류 정학도는 68.11%로서 연어 공기 기반 방법의 62.09% 보다 9.7% 향상된 성능을 보였다. 또한 두 자동 태깅 방법을 결합한 결과 태깅 정확도는 76.09%, 분류 정확도는 76.16%로 나타났다.


This study presents an effective word sense disambiguation model that does not require manual sense tagging process by automatically tagging the right sense using a machine-readable dictionary, and attempts to classify the senses of those words using a classifier built from the training data. The automatic tagging technique was implemnted by the dictionary information-based and the collocation co-occurrence-based methods. The dictionary information-based method that applied multiple feature selection showed the tagging accuracy of 70.06%, and the collocation co-occurrence-based method 56.33%. The sense classifier using the dictionary information-based tagging method showed the classification accuracy of 68.11%, and that using the collocation co-occurrence-based tagging method 62.09%. The combined tagging method applying data fusion technique achieved a greater performance of 76.09% resulting in the classification accuracy of 76.16%.


본 연구는 정규 과목으로서 정보이용교육을 수강하는 대학생들을 대상으로 이들의 컴퓨터활용능력과 도서관 관련 지식이 이용빈도와 정보활용능력에 어떠한 영향을 미치는지를 조사하고, 이용빈도와 정보활용능력은 어떠한 상관관계가 있는지를 분석하여 보다 나은 정보이용교육의 수업 방향을 제시하고자 함을 목적으로 하였다. 서울경기지역 소재 7개 대학의 8개 수업 수강생들을 대상으로 자료를 수집하였으며, 가설검증을 통해 변인들의 상관관계를 분석하였다. 정보이용교육의 중요성에 대한 대학당국의 인식과 더불어 향후의 정보이용교육은 도서관자료를 이용한 학술정보활용 중심으로 이루어져야 할 것임을 제안하였다.


The purpose of this study is to reveal how undergraduate students' computer literacy and library knowledge can affect their frequency of library material use and information literacy, and analyze the correlations between frequency of library material use and information literacy. Data were collected by distributing questionnaires to students of 7 universities in 8 credit-given user education courses, and correlations with variables were analyzed through hypothesis testing. It was suggested that with strong support of university administration, user education should be taught by using more of scholarly library material.


우리나라는 공공데이터 제공과 관련된 제도가 최근 제정되면서 정부기관 및 지방자치단체 등의 공공기관이 보유한 데이터를 적극적으로 개방하고 제공하는 방향으로 정책이 변화하고 있다. 개방의 목적은 크게 두 가지로 구분한다. 정부운영의 투명성을 확보하여 국민의 알 권리를 충족시키는 것이다. 다른 하나는 공공데이터를 하나의 국가부존 자산으로 활용하여 국익을 창출하기 위함이다. 이 연구에서는 공공데이터의 개방 현황을 분석하고 개선방안을 제시하였다. 연구범위는 지방자치단체에서 제공하는 공공데이터이기 때문에 서울특별시를 비롯한 17개 광역시도와 기초 자치단체 228개 시․군․구에서 보유한 것을 전수 조사하였다. 연구결과에 따르면 지방자치단체는 각 기관에서 생산 및 소장한 공공데이터에 대한 목록파악과 공개에 대해 상대적으로 소극적인 것과 개방 데이터의 포맷도 특정 소프트웨어에 의존적인 형태였다. 이러한 점을 해결하기 위해서는 궁극적으로 지역 공공데이터개방과 활용을 높일 방안으로 링크드 오픈 데이터 형태로 개방하는 필요성과 방안을 제시하였으며, 국가 공공데이터개방을 위한 통합 플랫폼을 통한 종합적 개방절차와 방안을 제안하였다.


In South Korea, systems related to the provision of public data were recently implemented. As a result, policy changes have been made that are headed in the direction of actively providing open access to data held by public institutions, such as government agencies and local municipalities. The purpose of the open I will be divided into two broad. To ensure the transparency of government operations, and is intended to satisfy the right to know the people. The other one is to create national interest by utilizing the public data as one country endowment assets. In this study, we analyze the open situation of public data, were presented the improvement measures. Range of research, the public data that local government owns, to determine to have a central information and other limitations and characteristics, Seoul the beginning to the seventeen regional support municipality 228 that you have held for city districts were census. According to the research results, local governments, themselves produced, is a relatively reluctant to disclosure and understanding of the list of public data that are holdings. According to the research results, local governments, themselves produced, is a relatively reluctant to disclosure and understanding of the list of public data that are holdings, also emphasizes the conservative value than take advantage of value have had. Therefore, it was determined that there is a need to resolve several issues through disclosure via a linked data format as a strategy to increase the openness and utilization of local public data.


본 연구는 고도화된 웹 서비스와 스마트 기기의 확산으로 인해 변화된 시스템 환경 속에서 클라우드 서비스에 대한 선호도와 이용의도에 영향을 미치는 데이터 안정성, 네트워크 반응속도, 그리고 시스템 접근성을 중심으로 정보센터의 이용도 향상에 대한 방향 설정을 위해 인지된 유용성, 인지된 이용 용이성을 중심으로 이용자의 이용의도와의 관계를 살펴보았다. 본 연구가설의 검증을 위해 태블릿PC, 스마트폰과 같은 모바일기기를 많이 이용하거나 관심이 높은 20대에서 30대 연령층의 114명으로 부터 설문을 받아 활용하였다. 클라우드 서비스 선호도에 대한 이용자의 인지된 유용성과 인지된 이용용이성에 영향을 미칠 수 있는 정보센터의 시스템 품질특성과 관련된 요인들과의 관계를 살펴봄으로써 최근의 클라우드 서비스를 위해 새롭게 고려되어야 할 정보센터의 시스템 품질특성에 대해 이용자 이용의도 관점에서 논의하였다.


The purpose of this study is to identify the new roles and services of information center that is affected by changing information technology so called cloud computing service. Using Information Technology acceptance model, hypotheses were developed to find relationships among intention to use of a cloud service, perceived usefulness, perceived easy of use and three system quality evaluation factors such as data safety, network response time, and system accessibility. The hypotheses have been tested with 114 user surveys. This study presents the relationship between certain attitude and intention to use variables and system accessibility applying clouding service. The result of this research gives an insight of the evaluation and a guideline for the implementation of cloud computing services in information centers.
