
본문 바로가기 주메뉴 바로가기

ACOMS+ 및 학술지 리포지터리 설명회

  • 한국과학기술정보연구원(KISTI) 서울분원 대회의실(별관 3층)
  • 2024년 07월 03일(수) 13:30


검색어: 사용성, 검색결과: 16
백지원(이화여자대학교) ; 정연경(이화여자대학교) 2006, Vol.23, No.1, pp.63-81 https://doi.org/10.3743/KOSIM.2006.23.1.063

본 연구는 모든 지식조직체계의 근간인 용어관계가 동일성, 계층성, 연관성이라는 세 가지 포괄적인 기준에 의해 정의되어 사용됨으로써 정보의 정확성이 중시되는 오늘날의 정보 환경에서 제 기능을 다하지 못하고 있으므로, 그 해결 방안의 하나로 용어관계의 분류 모형을 제시하고자 하는데 목적이 있다. 이를 위해 기존의 여러 지식조직체계에 나타나는 각종 용어관계의 사례와 용어관계에 대한 이론적 연구들을 광범위하게 수집하여 다양한 용어관계의 유형을 파악하였다. 그리고 이를 바탕으로 용어관계를 명확하게 정의하고 범주화할 수 있는 용어관계 분류의 근거를 세우고 용어관계의 분류 모형을 개발하였다. 더 나아가 이 분류 모형을 정보검색을 비롯한 다양한 방면에 활용할 수 있는 방안을 모색하고 향후 용어관계 분류 연구에 대한 제언을 했다.용어관계의 분류 모형 개발에 관한 연구*


The purpose of this study is to present the limitation of terminological relationships in the current information environment and to propose a solution to result the richer and refined terminological resources. For this, various kinds of terminological relationships in knowledge organization systems and theoretical researches were collected and analyzed. Based upon the analysis, a methodology for classification of terminological relationships was suggested and classification models were presented. Additionally, four suggestions were made for the practical uses of the classification models.


학술지 논문에 디스크립터를 자동부여하기 위하여 기계학습 기반의 접근법을 적용하였다. 정보학 분야의 핵심 학술지를 선정하여 지난 11년간 수록된 논문들을 대상으로 문헌집단을 구성하였고, 자질 선정과 학습집합의 크기에 따른 성능을 살펴보았다. 자질 선정에서는 카이제곱 통계량(CHI)과 고빈도 선호 자질 선정 기준들(COS, GSS, JAC)을 사용하여 자질을 축소한 다음, 지지벡터기계(SVM)로 학습한 결과가 가장 좋은 성능을 보였다. 학습집합의 크기에서는 지지벡터기계(SVM)와 투표형 퍼셉트론(VPT)의 경우에는 상당한 영향을 받지만 나이브 베이즈(NB)의 경우에는 거의 영향을 받지 않는 것으로 나타났다.


This study utilizes various approaches of machine learning in the process of automatically assigning descriptors to journal articles. After selecting core journals in the field of information science and organizing test collection from the articles of the past 11 years, the effectiveness of feature selection and the size of training set was examined. In the regard of feature selection, after reducing the feature set by χ2 statistics(CHI) and criteria which prefer high-frequency features(COS, GSS, JAC), the trained Support Vector Machines(SVM) performs the best. With respective to the size of the training set, it significantly influences the performance of Support Vector Machines(SVM) and Voted Perceptron(VTP). but it scarcely affects that of Naive Bayes(NB).

남영준(중앙대학교) ; 정의섭(한국과학기술정보) 2006, Vol.23, No.1, pp.221-241 https://doi.org/10.3743/KOSIM.2006.23.1.221

본 연구에서는 인용 정보를 활용하여, 특허 인용색인의 기법을 분석하고, 이를 바탕으로 새로운 특허지수를 제시하였다. 이를 위해 문헌정보 및 특허정보 관련 인용색인데이터베이스에서 제공하는 인용색인지수를 비교 분석하였다. 특히 JCR의 영향력 지수와 CHI의 기술영향력 지수가 갖고 있는 정보적 가치와 의미를 재해석하였다. 전자는 상대적 인용빈도를 사용하여, 연속간행물과 같은 매체의 가치를 중시하고 있다. 후자의 경우는 특허고유의 가치를 평가하기 때문에, 자체정보만을 중시하고 있다. 이러한 차이점을 극복하기 위해 후자의 경우 해당 특허를 보유하고 있는 기관의 기술영향력 지수를 이용하여 상대적 가치를 재부여하였다. 이를 보완하기 위해 인용정보에 기반하여 다음 특정 특허의 피인용지수를 비롯하여 상대적 반감기 평가지수, 특허기술 활용 통합지수 등 세가지의 새로운 지수를 제안하였다. 단 비교분석대상은 출원특허사항에 인용정보를 제시하고 있는 미국 특허정보로 제한하여 국내 특허정보에 대한 비교분석은 수행하지 못하였다.


This research suggested a new patent information based on patent citation technique using cited information. For this purpose, comparison research on library and patent information related citation database providing citation index was done. The information quality and meaning on the impact factor of JCR and the technology factor of CHI was reinterpreted. The former emphasizes the quality of continuous publication using relative citation frequency. The latter only emphasizes the information itself because it assesses the quality of patent characteristics. To overcome these difficulties, the latter re-authorized a relative quality to the organization possessing the patent using technology impact factor. Three new patent index was proposed on the basis of cited information to complement this. However, the comparative object was limited to American patent information that presented cited information of patent applied cases, and the comparison and research of domestic patent information could not be done.

구중억(한국기초과학지원연구원) ; 이응봉(충남대학교) 2006, Vol.23, No.3, pp.49-68 https://doi.org/10.3743/KOSIM.2006.23.3.049

도서관 이용자에게 장애가 없는 정보서비스를 제공하기 위해서는 OPAC의 접근성, 사용성 및 검색성을 향상시키고, 도서의 검색, 식별 및 브라우징의 도구로써 ISBN의 활용가치를 높이는 것이 필요하다. 북마크릿은 웹브라우저의 ‘즐겨찾기에 추가’ 또는 ‘툴바’에 드래그하여 저장할 수 있는 작은 크기의 자바스크립트이다. 그리고 오픈소스인 북마크릿은 웹페이지에서 ISBN을 추출한 다음, 해당 ISBN으로 도서관의 OPAC에서 도서를 검색할 수 있는 간단하지만 강력한 검색도구이다. 해외의 도서관 시스템 벤더, 도서관, OCLC 등은 이용자가 온라인서점의 웹페이지를 살펴보면서 동시에 도서관의 소장 및 대출 정보를 실시간으로 검색할 수 있는 북마크릿을 제공하고 있다. 따라서 본 연구에서는 해외에서 개발되어 활용되고 있는 네 가지 유형의 북마크릿에 대한 적용사례 분석을 통해 북마크릿의 특징과 장단점을 정리하였다. 이를 통해서 북마크릿의 기본요건과 적용모델을 도출하고, 국내 도서관의 OPAC과 온라인서점에서 북마크릿을 활용한 Library Lookup 서비스 제공방안을 제안하였다.


It is required to enhance the value of ISBN as a tool for book search, identification, and browsing, and improve the accessability and search capability of library OPAC. Bookmarklet is a small size javascript which can be saved as URL in a web browser bookmark or web page hyperlink. Open source bookmarklet can extract ISBN from web pages and search a book from library OPAC using the ISBN, so it is recognized as a simple but powerful search tool. In foreign countries, commercial library system vendors, libraries, OCLC, etc. are providing bookmarklets which allow a user to search for library holdings and loan information in a real time while he/she is travelling in an online bookshop web page. Therefore, this paper compared and analyzed international bookmarklets application examples and proposed LibraryLookup service in which library OPAC and online bookshop can make use of the bookmarklets.

김성진(Syarcuse University, USA) ; 정동열(이화여자대학교) 2006, Vol.23, No.2, pp.21-37 https://doi.org/10.3743/KOSIM.2006.23.2.021

학문의 지식체계를 형성하는데 있어서 하나의 일련과정으로 밀접하게 상호연관된 이론개발 및 이론활용 연구가 뒷받침되어야 한다는 전제 하에, 본 연구는 문헌정보학 연구논문의 이론개발 및 이론활용 사례의 양적/질적 측면을 조사함으로써 문헌정보학의 이론적 기반을 분석하고자 하였다. 특히, 본 연구는 세부주제영역에 따른 이론개발 및 이론활용 연구의 특성에 주목함으로써 문헌정보학의 이론적 기반 형성에 기여한 세부주제영역을 보다 구체적으로 파악하고자 하였다. 이를 위해 1984년부터 2003년에 출판된 1,661편의 연구논문을 대상으로 내용분석을 실시하였다. 분석결과, 22개의 세부주제영역 중에서 정보이용탐색, 정보검색, 도서관경영, 학술커뮤니케이션 영역이 이론개발과 이론활용의 모든 측면에 가장 큰 기여를 한것으로 나타났다. 또한 주제영역별로 생산된 논문 수에 따른 이론적 연구의 비율을 살펴보았을 때, 계량정보학과 전문직 영역에 대한 연구가 매우 이론적인 특성을 보였다. 이 외에 각 세부주제영역별로 사용된 이론을 분석하였을 때, 일부 세부주제영역 간에 유사한 이론적 기반을 공유하고 있는 것으로 나타났다.


Based upon the assumption that both theory building and theory use are intertwined to construct a cohesive body of knowledge in the filed, this study attempts to identify the state of theoretical framework by examining the number and the quality of theoretical articles by subfield. Theoretical article is characterized as an incident in which in which the author contributes to the development or the use of theory in his/her own paper. Theoretical incidents were identified by a content analysis of 1,661 articles in four LIS journals from 1984 to 2003. The findings suggest that the four subfields, such as information seeking/use, information retrieval, library management, and scholar communication had great contributions to both theory building and theory use. Also, two research areas such as bibliometrics and professionals are very likely to be theoretical. Further, the analysis of the name of theories used by subfields could give an insight into the understanding of how the theoretical frameworks of each subfield are related.


본 연구는 실재 시스템 환경에서 문헌 분류를 위해 범주화 기법을 적용할 경우, 범주화 성능이 어느 정도이며, 적정한 문헌범주화 성능의 달성을 위하여 분류기 학습에 필요한 범주당 가장 이상적인 학습문헌집합의 규모는 무엇인가를 파악하기 위하여 kNN 분류기를 사용하여 실험하였다. 실험문헌집단으로15만 여건의 실제 서비스되는 데이터베이스에서 2,556건 이상의 문헌을 가진 8개 범주를 선정하였다. 이들을 대상으로 범주당 학습문헌수 20개(Tr20)에서 2,000개(Tr2000)까지 단계별로 증가시키며 8개 학습문헌집합 규모를 갖도록 하위문헌집단을 구성한 후, 학습문헌집합 규모에 따른 하위문헌집단 간 범주화 성능을 비교하였다. 8개 하위문헌집단의 거시평균 성능은 F1 값 30%로 선행연구에서 발견된 kNN 분류기의 일반적인 성능에 미치지 못하는 낮은 성능을 보였다. 실험을 수행한 8개 대상문헌집단 중 학습문헌수가 100개인 Tr100 문헌집단이 F1 값 31%로 비용대 효과면에서 분류기 학습에 필요한 최적정의 실험문헌집합수로 판단되었다. 또한, 실험문헌집단에 부여된 주제범주 정확도를 수작업 재분류를 통하여 확인한 후, 이들의 범주별 범주화 성능과 관련성을 기반으로 위 결론의 신빙성을 높였다.


This paper examines a level of categorization performance in a reallife collection of abstract articles in the fields of science and technology, and tests the optimal size of documents per category in a training set using a kNN classifier. The corpus is built by choosing categories that hold more than 2,556 documents first, and then 2,556 documents per category are randomly selected. It is further divided into eight subsets of different size of training documents: each set is randomly selected to build training documents ranging from 20 documents (Tr20) to 2,000 documents (Tr2000) per category. The categorization performances of the 8 subsets are compared. The average performance of the eight subsets is 30% in F1 measure which is relatively poor compared to the findings of previous studies. The experimental results suggest that among the eight subsets the Tr100 appears to be the most optimal size for training a kNN classifier. In addition, the correctness of subject categories assigned to the training sets is probed by manually reclassifying the training sets in order to support the above conclusion by establishing a relation between and the correctness and categorization performance.
