
본문 바로가기 주메뉴 바로가기

ACOMS+ 및 학술지 리포지터리 설명회

  • 한국과학기술정보연구원(KISTI) 서울분원 대회의실(별관 3층)
  • 2024년 07월 03일(수) 13:30


검색어: collection, 검색결과: 277
김홍렬(전주대학교) 2005, Vol.22, No.3, pp.85-102 https://doi.org/10.3743/KOSIM.2005.22.3.085

본 연구의 목적은 생명과학분야 연구자들의 인용문헌 형태와 국외정보의 의존도를 밝히고, 주제별, 개발과 장서평가 및 폐기와 관련된 도서관 정책을 수립하는데 필요한 근거자료를 확보하는데 있다. 이를 위하여 생명과학분야에 해당하는 의학, 약학, 식품, 농학, 미생물분야의 학술지 기사의 인용문헌의 특성을 비교 분석하였다. 그 결과, 연구자는 학술지를 가장 많이 인용하고 있었으며, 해외의존도는 미생물분야가 반감기가 8.98년으로 가장 긴 것으로 나타났으며, 미생물분야가 7.38년, 식품분야가 7.1년, 약학분야가 6.96년의 순으로 높았으며, 의학분야는 6.73년으로 가장 짧은 반감기를 보였다.


The purpose of this study is to analysis the type of cited mate rials, dependence ratio of foreign information of domestic researchers, and to predicts half-life of life science for the collection development of libraries and user friendly information services extracted from five subjects-medical science, pharmacy, food sc ience, agricultural science, microbiology. In result, it was found that it citing the schola rly journal most plentifully, and dependence ratio of foreign infor mation of domestic researchers was high most the microbiology. And then, half-life of life science was found 8.98 in agricultu and 6.96 in pharmacy, and so on.


학술지 논문에 디스크립터를 자동부여하기 위하여 기계학습 기반의 접근법을 적용하였다. 정보학 분야의 핵심 학술지를 선정하여 지난 11년간 수록된 논문들을 대상으로 문헌집단을 구성하였고, 자질 선정과 학습집합의 크기에 따른 성능을 살펴보았다. 자질 선정에서는 카이제곱 통계량(CHI)과 고빈도 선호 자질 선정 기준들(COS, GSS, JAC)을 사용하여 자질을 축소한 다음, 지지벡터기계(SVM)로 학습한 결과가 가장 좋은 성능을 보였다. 학습집합의 크기에서는 지지벡터기계(SVM)와 투표형 퍼셉트론(VPT)의 경우에는 상당한 영향을 받지만 나이브 베이즈(NB)의 경우에는 거의 영향을 받지 않는 것으로 나타났다.


This study utilizes various approaches of machine learning in the process of automatically assigning descriptors to journal articles. After selecting core journals in the field of information science and organizing test collection from the articles of the past 11 years, the effectiveness of feature selection and the size of training set was examined. In the regard of feature selection, after reducing the feature set by χ2 statistics(CHI) and criteria which prefer high-frequency features(COS, GSS, JAC), the trained Support Vector Machines(SVM) performs the best. With respective to the size of the training set, it significantly influences the performance of Support Vector Machines(SVM) and Voted Perceptron(VTP). but it scarcely affects that of Naive Bayes(NB).


본 연구에서는 의견이나 감정을 담고 있는 의견 문서들의 자동 분류 성능을 향상시키기 위하여 개념색인의 하나인 잠재의미색인 기법을 사용한 분류 실험을 수행하였다. 실험을 위해 수집한 1,000개의 의견 문서는 500개씩의 긍정 문서와 부정 문서를 포함한다. 의견 문서 텍스트의 형태소 분석을 통해 명사 형태의 내용어 집합과 용언, 부사, 어기로 구성되는 의견어 집합을 생성하였다. 각기 다른 자질 집합들을 대상으로 의견 문서를 분류한 결과 용어색인에서는 의견어 집합, 잠재의미색인에서는 내용어와 의견어를 통합한 집합, 지도적 잠재의미색인에서는 내용어 집합이 가장 좋은 성능을 보였다. 전체적으로 의견 문서의 자동 분류에서 용어색인 보다는 잠재의미색인 기법의 분류 성능이 더 좋았으며, 특히 지도적 잠재의미색인 기법을 사용할 경우 최고의 분류 성능을 보였다.


The aim of this study is to apply latent semantic indexing(LSI) techniques for efficient automatic classification of opinionated documents. For the experiments, we collected 1,000 opinionated documents such as reviews and news, with 500 among them labelled as positive documents and the remaining 500 as negative. In this study, sets of content words and sentiment words were extracted using a POS tagger in order to identify the optimal feature set in opinion classification. Findings addressed that it was more effective to employ LSI techniques than using a term indexing method in sentiment classification. The best performance was achieved by a supervised LSI technique.


본 연구에서는 공공도서관의 서비스 프로그램 운영과정에서 생산된 ‘서비스 데이터’를 서지데이터와 연계하여 도서관 목록을 개선시키고자 하였다. 이를 위해 2015년에 우수 도서관으로 선정된 공공도서관 7곳을 대상으로 서비스 데이터를 수집하고 분석하였다. 이를 바탕으로 서지데이터와 서비스 데이터를 서지프레임워크를 적용하여 시범적으로 연계하고, 활용 가능한 인터페이스를 제안하였다. 본 연구결과는 1) 선별적이고 가치 평가가 포함된 서지데이터를 확보하고, 2) 장서의 생애주기 동안 서지데이터를 지속적으로 업데이트할 수 있게 되며, 3) 체계적으로 관리되기 어려웠던 서지데이터의 보존성과 공유 가능성을 향상시킬 수 있으며, 4) 시맨틱웹 환경에서 외부 링크드 데이터를 추가적으로 연계할 수 있는 서지데이터 개발을 위한 기초자료로 활용될 수 있을 것이다.


This study aims to improve bibliographic data of public libraries by linking service data, which are produced out of library service programs. Service data collected from the seven award-winning public libraries were selected and analyzed. A Bibliographic Framework is used for linking bibliographic data and service data. Interfaces are also suggested for the two-way data linking. The results can be used to obtain 1) selective and value-added bibliographic data, 2) bibliographic data updated continuously throughout the lifecycle, 3) structured service data for preservation and sharing, and 4) bibliographic data linked to the additional external linked data.

남은경(연세대학교) ; 박지홍(연세대학교) 2014, Vol.31, No.4, pp.201-227 https://doi.org/10.3743/KOSIM.2014.31.4.201

사회 전반적으로 협업의 중요성과 필요성이 강조되고 있으며, 연구자들의 협업 역시 증가하고 있다. 연구자의 협업에는 학자로서의 특성이 반영된다는 점에서 특이성을 가진다. 본 연구는 연구자 협업 패턴에 영향을 미치는 요인을 알아보기 위해 가설을 설정하고 이를 검증하였다. 영향 요인은 연구자들의 협업 행태 및 동기에 대한 선행연구를 토대로 추출하였으며, 계량정보학 분야 연구자들을 대상으로 네트워크 분석과 설문 분석의 두 가지 방법을 활용하여 가설을 검증하였다. 설문은 네트워크 분석에 포함된 연구자를 대상으로 한 웹 설문으로 진행하였다. 본 연구 결과는 연구자 인식 분석을 통한 개인적 선택 요인과 관계 계량정보학 분석을 통한 집단적 결과 요인을 분석했다는 점에서 의의가 있으며, 연구자 협업을 장려하는 정책 및 디지털 협업서비스 기획 등에 활용될 수 있을 것이라 기대된다.


The collaboration is becoming ever more widespread in scientific research. Unlike collaboration in other areas such as in a company, research collaboration has an unique feature that it is reflected by scholars’ characteristics. Based on previous studies on research collaboration, five major factors are identified. We propose five hypotheses from them and examine these by using both in-person questionnaire survey and relational bibliometric analysis. The survey analysis informs individual choice factors and the bibliometric analysis informs collective consequence factors. The results of this study may have implications for science policies and digital collaboration services.


XML 웹 문서 포맷은 문헌 내에 내용뿐만 아니라 의미 있는 논리적인 구조 정보를 포함할 수 있어, 검색에서 문서의 내용 뿐만 아니라 구조로 접근하는 것을 제공한다. 그래서 본 연구의 목적은 XML 검색에 있어 내용 검색에 추가적인 요소로 사용된 구조적인 제한이 얼마나 유용한지를 실험하기 위해 내용만으로 검색한 결과와 내용과 구조적인 제한을 가지고 검색한 결과간의 성능을 비교하였다. 이 실험은 자체 개발된 단말노드 언어모델기반의 XML 검색시스템을 사용하였고 INEX 2005의 ad-hoc트랙에 참여하여 모든 실험방법과 INEX 2005의 실험 문헌 집단을 사용하였다.


XML documents format on the Web provides a mechanism to impose their content and logical structure information. Therefore, an XML processor provides access to their content and strucure. The purpose of this study is to investigate the usefulness of structural hints in the leaf node language model-based XML document retrieval. In order to this purpose, this experiment tested the performances of the leaf node language model-based XML retrieval system to compare the queries for a topic containing only content-only constraints and both content constrains and structure constraints. A newly designed and implemented leaf node language model-based XML retrieval system was used. And we participated in the ad-hoc track of INEX 2005 and conducted an experiment using a large-scale XML test collection provided by INEX 2005.

지선영(경기대학교 일반대학원 문헌정보학과) ; 최성필(경기대학교 문헌정보학과) 2021, Vol.38, No.1, pp.221-242 https://doi.org/10.3743/KOSIM.2021.38.1.221

본 연구에서는 사전학습 된 언어 모델을 기반으로 양방향 게이트 순환 유닛 모델과 조건부 랜덤 필드 모델을 활용하여 참고문헌을 구성하는 메타데이터를 자동으로 인식하기 위한 연구를 진행하였다. 실험 집단은 2018년에 발행된 학술지 40종을 대상으로 수집한 PDF 형식의 학술문헌 53,562건을 규칙 기반으로 분석하여 추출한 참고문헌 161,315개이다. 실험 집합을 구축하기 위하여 PDF 형식의 학술 문헌에서 참고문헌을 분석하여 참고문헌의 메타데이터를 자동으로 추출하는 연구를 함께 진행하였다. 본 연구를 통하여 가장 높은 성능을 나타낸 언어 모델을 파악하였으며 해당 모델을 대상으로 추가 실험을 진행하여 학습 집합의 규모에 따른 인식 성능을 비교하고 마지막으로 메타데이터별 성능을 확인하였다.


This study applied reference metadata recognition using bidirectional GRU-CRF model based on pre-trained language model. The experimental group consists of 161,315 references extracted by 53,562 academic documents in PDF format collected from 40 journals published in 2018 based on rules. In order to construct an experiment set. This study was conducted to automatically extract the references from academic literature in PDF format. Through this study, the language model with the highest performance was identified, and additional experiments were conducted on the model to compare the recognition performance according to the size of the training set. Finally, the performance of each metadata was confirmed.


최근 수년 동안 영상자료와 음성자료 분석에 대한 이론들이 텍스트자료 검색 시스템과 함께 사용되기 위해서 제안 되어 왔으며 데이터 처리 속도의 급격한 향상과 함께 발전되어 왔다. 일반적 검색 방법들은 단지 텍스트만을 사용하지만 텍스트와 그림을 동시에 사용하는 검색 방법 또한 최근에 제안되어 왔다. 본 연구는 다매체자료의 공통기술표현포맷(CRFMD)이라는 이름으로 화상자료와 텍스트자료를 하나의 자료 구조로 통합하는 방법을 제안하고 있으며, 주어진 테스트자료에 대한 화상자료의 유사성 분석에서 텍스트와 그림의 형태소를 함께 사용하였을 때 현격히 개선되어 짐을 보여주고 있다. CRFMD는 의료문서 검색, WWW 검색, 박물관 소장품 검색과 같은 다양한 분야의 다매체자료 검색 및 처리에 응용될 수가 있을 것이다.


In recent years, theories of image and sound analysis have been proposed to work with text retrieval systems and have progressed quickly with the rapid progress in data processing speeds. This study proposes a common representation format for multimedia documents (CRFMD) composed of both images and text to form a single data structure. It also shows that image classification of a given test set is dramatically improved when text features are encoded together with image features. CRFMD might be applicable to other areas of multimedia document retrieval and processing, such as medical image retrieval, World Wide Web searching, and museum collection retrieval.


본 연구는 ‘독서의 달’ 프로그램의 주요 이용자 유형을 밝히기 위한 것이다. 이 목적을 달성하기 위하여, 7대도시 지역(서울, 부산, 대구, 인천, 대전, 광주, 울산)의 62개 표본 공공도서관으로부터 9월의 ‘독서의 달’ 프로그램 622개를 그들의 홈페이지를 통하여 조사 수집하였다. 이렇게 수집된 프로그램을 대상으로 본 연구에서는 내용분석법과 크리펜도르프(Krippendorff)의 신뢰계수 알파(α)를 사용하여 이들 프로그램을 지역별로 그리고 이용자 유형별로 분석하였다. 그 결과, 본 연구에서는 7대도시 각 지역별로 공공도서관이 선호하는 주요 이용자 유형의 순위에는 약간씩 차이가 있다는 것과 모든 대도시지역의 공공도서관에서 가장 중요한 이용자 유형은 어린이 또는 전연령층이라는 것이 밝혀졌다.


This study investigated the main user types of the reading programs which are provided by sixty-two public libraries during September, “the Month of Reading,” in seven metropolitan cities, Seoul, Pusan, Daegu, Incheon, Daejeon, Gwangju and Ulsan. For the analysis, the data are collected from 622 programs of “the Month of Reading.” The content analysis method was used to analyze data and find meanings from it. The findings show, there are a little differences in the priority order of the main user types among the seven metropolitan cities, however, the children and all ages of the public libraries in seven metropolitan cities are identified as the main user types of the libraries.

장혜란(상명대학교) ; 오의경() 2006, Vol.23, No.3, pp.205-221 https://doi.org/10.3743/KOSIM.2006.23.3.205

대학도서관 이용자의 도서관불안을 측정하여 분석하기 위하여, A대학교 도서관이용자를 체계적으로 표집하여 설문조사(LAS)를 수행하였다. 707명의 도서관이용자로부터 수집된 데이터의 기초통계를 분석하여 불안의 정도를 파악하고 선행연구 결과와 비교하였으며, 성별, 학년, 전공계열, 도서관방문빈도, 도서관이용교육과 도서관불안과의 관계를 분석하였다. 도서관불안을 나타내는 LAS 점수는 2.55점이고, 성별, 학년별, 전공계열별로 차이가 있다. 도서관이용교육은 도서관직원으로 인한 도서관불안을 감소시키며, 도서관방문빈도의 증가에 따라 도서관불안이 감소하는 것으로 나타났다. 특히 정서적 장벽으로 인한 불안은 학년이 높고, 도서관방문빈도가 증가할수록 감소되는 것으로 나타났다. 분석 결과에 기초하여 도서관불안을 해소할 수 있는 방안을 제시하였다.


To investigate the present states and analyze the library anxiety among academic library users, A University library users sampled systematically and surveyed. Data collected from 707 students are analyzed and compared with the previous studies. The average LAS score is 2.55 and show differences in sex, grade levels, and major areas of study. Library use instruction reduces anxiety subscale of barriers with staff. Library anxiety is also differed according to the frequency of library visit. Especially, the anxiety subscale of affective barriers is decreased according to the grade level and frequency of library visit. Based on the results, recommendations are suggested to overcome the library anxiety.
