
본문 바로가기 주메뉴 바로가기


검색어: 이용연구, 검색결과: 448
김수연(연세대학교) ; 정영미(연세대학교) 2006, Vol.23, No.3, pp.147-165 https://doi.org/10.3743/KOSIM.2006.23.3.147

이 연구에서는 전체 문헌집단으로부터 초기 질의어에 대한 연관용어 선정 시 사용할 수 있는 최적의 기법을 찾기 위해 연관규칙 마이닝과 용어 클러스터링 기법을 이용하여 연관용어 선정 실험을 수행하였다. 연관규칙 마이닝 기법에서는 Apriori 알고리즘을 사용하였으며, 용어 클러스터링 기법에서는 연관성 척도로 GSS 계수, 자카드계수, 코사인계수, 소칼 & 스니스 5, 상호정보량을 사용하였다. 성능평가 척도로는 연관용어 정확률과 연관용어 일치율을 사용하였으며, 실험결과 Apriori 알고리즘과 GSS 계수가 가장 좋은 성능을 나타냈다.


In this study, experiments for selection of association terms were conducted in order to discover the optimum method in selecting additional terms that are related to an initial query term. Association term sets were generated by using support, confidence, and lift measures of the Apriori algorithm, and also by using the similarity measures such as GSS, Jaccard coefficient, cosine coefficient, and Sokal & Sneath 5, and mutual information. In performance evaluation of term selection methods, precision of association terms as well as the overlap ratio of association terms and relevant documents' indexing terms were used. It was found that Apriori algorithm and GSS achieved the highest level of performances.

정미정(명지대학교) ; 권나현(명지대학교) 2014, Vol.31, No.2, pp.99-119 https://doi.org/10.3743/KOSIM.2014.31.2.099

본 연구는 현재 다양한 형태로 시행되고 있는 국내 대학도서관 맞춤형 이용자 교육의 전반적인 운영 현황을 조사하고, 이를 토대로 해당 교육을 활성화하는데 필요요건과 장애요인을 파악하고자 하는 목적으로 실시되었다. 전국 4년제 대학 중앙도서관을 대상으로 전수조사하여 총 206개관의 웹사이트에서 맞춤형 교육의 전반적인 사항을 파악한 후, 설문지법을 통해 교육 운영 현황을 조사하였다. 연구결과, 설문에 응답한 총 149개관 가운데 94개관(63.1%)에서 맞춤형 교육을 운영하고 있었으며, 55개관(36.9%)에서는 해당 교육을 시행하지 않고 있었다. 국내 대학도서관 맞춤형 교육은 예산, 사서 수 등 도서관의 가용자원이 많을수록 더 활성화되어 있었으며, 사서의 자질 중에서는 학력, 전공 등과 같은 능력보다 봉사정신이 교육 운영 활성화에 더 영향력 있는 요소로 밝혀졌다. 본 연구결과는 대학도서관 실무자들에게 맞춤형 교육 운영과 서비스에 대한 기초정보를 제공하고, 향후 후속 연구의 토대가 되는 기반연구로 활용될 수 있을 것이다.


The purpose of this study was to investigate the current practices of the customized bibliographic instructions (CBI) at four-year academic libraries in Korea. Among the entire 206 academic libraries, a total of 149 libraries participated in the survey. Study result shows that the libraries providing CBI was 63.1%. The findings of the study revealed the overall picture of the CBI operated in Korean academic libraries. The findings of the study suggested useful strategies to apply in adopting and operating the CBI in academic libraries in Korea.

김경선(University of Wisconsin - Madison) ; 유이은영(North Carolina Central University) ; 권나현(명지대학교) 2013, Vol.30, No.3, pp.7-21 https://doi.org/10.3743/KOSIM.2013.30.3.007


The study examines two aspects that relate to undergraduates’ selection and use of information sources for their academic assignments: (1) sources perceived useful vs. sources frequently used, and (2) source characteristics considered important as selection criteria vs. selection criteria used as reflected in characteristics of frequently used sources. A survey of 251 undergraduate students attempted to address the gaps between what students think they should do and what they actually do with regard to source selection. Characteristics of frequently used sources were analyzed to find out the criteria used for source selection. Friends/family were among the frequently used sources although they were not perceived as useful. Unlike other sources suffering gaps between the perceived usefulness and the use behavior, Web sources were the ones not only perceived most useful but also used most frequently. When the important selection criteria were compared with the characteristic of sources used often, students did not seem to actually use the selection criteria they thought important. While students considered some characteristics related to information quality (e.g., accuracy, comprehensiveness) as important criteria for source selection, the actual criteria they applied for choosing information sources could be described as ‘convenient’ or ‘accessible’ (e.g., efficient/time saving, easy to use, familiar, accessible). Based on the findings, suggestions were made to help bridge such gaps through information literacy programs and information systems design.

남영준(중앙대학교) ; 정의섭(한국과학기술정보) 2006, Vol.23, No.1, pp.221-241 https://doi.org/10.3743/KOSIM.2006.23.1.221

본 연구에서는 인용 정보를 활용하여, 특허 인용색인의 기법을 분석하고, 이를 바탕으로 새로운 특허지수를 제시하였다. 이를 위해 문헌정보 및 특허정보 관련 인용색인데이터베이스에서 제공하는 인용색인지수를 비교 분석하였다. 특히 JCR의 영향력 지수와 CHI의 기술영향력 지수가 갖고 있는 정보적 가치와 의미를 재해석하였다. 전자는 상대적 인용빈도를 사용하여, 연속간행물과 같은 매체의 가치를 중시하고 있다. 후자의 경우는 특허고유의 가치를 평가하기 때문에, 자체정보만을 중시하고 있다. 이러한 차이점을 극복하기 위해 후자의 경우 해당 특허를 보유하고 있는 기관의 기술영향력 지수를 이용하여 상대적 가치를 재부여하였다. 이를 보완하기 위해 인용정보에 기반하여 다음 특정 특허의 피인용지수를 비롯하여 상대적 반감기 평가지수, 특허기술 활용 통합지수 등 세가지의 새로운 지수를 제안하였다. 단 비교분석대상은 출원특허사항에 인용정보를 제시하고 있는 미국 특허정보로 제한하여 국내 특허정보에 대한 비교분석은 수행하지 못하였다.


This research suggested a new patent information based on patent citation technique using cited information. For this purpose, comparison research on library and patent information related citation database providing citation index was done. The information quality and meaning on the impact factor of JCR and the technology factor of CHI was reinterpreted. The former emphasizes the quality of continuous publication using relative citation frequency. The latter only emphasizes the information itself because it assesses the quality of patent characteristics. To overcome these difficulties, the latter re-authorized a relative quality to the organization possessing the patent using technology impact factor. Three new patent index was proposed on the basis of cited information to complement this. However, the comparative object was limited to American patent information that presented cited information of patent applied cases, and the comparison and research of domestic patent information could not be done.


최근 이용자들이 정보를 공동생산하고 소비하는 웹기반 서비스들이 활발해지면서 이용자가 정보를 이용한 기록이나 이용자가 습득한 정보를 활용하여 생산한 다양한 부가 정보들이 다시 이용자에게 제공되고 있다. 또한 쌍방향으로 이용자들이 소통할 수 있는 정보채널이 다양해짐으로써 공통된 관심사를 가진 이용자의 정보소비 경험을 공유할 수 있는 방법이 활발하게 모색되고 있다. 이 연구에서는 동시출현정보 분석기법과 자아중심 네트워크 분석 기법을 적용하여 IMDB 서비스의 기존 이용자들이 자신이 보고 싶거나 좋아하는 영화를 선별하여 만들어 놓은 영화리스트에 나타난 정보를 토대로 특정 영화를 좋아하는 이용자가 선호할 만한 다른 영화를 찾아낼 수 있도록 연관영화정보를 다각적으로 표현하였다. 한 영화를 기준으로 연관 영화, 감독, 장르로 분석을 한 결과 영화의 테마나 주인공성향과 같은 다양한 자질로도 연관영화가 연결되었고 감독의 경우 영화내용보다는 감독의 인지도에 영향을 받는 것으로 나타났다. 또한 영화는 주제의 복합성이 큰 것으로 나타나 장르가 연관영화정보를 제공하기에 적합하지 않은 것으로 분석되었다.


Recently, many information services allow users to collaborate to produce and use information. Sharing information is also important for users who have similar taste or interest. As various channels are available for users to share their experiences and knowledge, users’ data have also been accumulated within the information services. This study collected movie lists made by users of IMDB service. Co-word analysis and ego-centered network analysis were adapted to discover relevant information for users who chose a specific movie. Three factors of movies including movie title, director and genre were used to present related movie information. Movie title is an effective feature to present related movies with various aspects such as theme or characters and the popularity of directors affects on identifying related directors. Genre is not useful to find related movies due to the complexity in the topic of a movie.

최상희(대구가톨릭대학교) ; 서은경(한성대학교) 2006, Vol.23, No.2, pp.229-243 https://doi.org/10.3743/KOSIM.2006.23.2.229

질의응답문서는 이용자가 입력한 질의, 질의설명, 답을 아는 다른 이용자가 제시한 응답으로 구성된 구조화된 문서로서, 최근 웹 문서처럼 검색이 일반적으로 일어나고 있는 정보원이다. 이 연구에서는 질의응답문서의 구조적 특성을 기반으로 질의를 재생성하여 질의응답문서의 검색효율을 향상시키고자 하였다. 질의재생성 실험에서 성능이 비교된 문서구조는 질의와 응답내용이다. 질의를 기반으로 질의를 재생성하는 방식에서는 질의응답검색 시스템에 입력되어 있는 유사질의를 활용하여 클러스터링하는 기법이 적용되었다. 응답정보를 기반으로 질의를 재생성하는 방식에서는 가장 유사한 기존 질의에 대해 응답된 내용에서 단락검색으로 적합한 문장들을 선정하여 활용하는 기법이 적용되었다. 실험 결과 응답정보를 활용하여 질의를 재생성하는 방식이 정확률은 유지하면서 더 다양한 검색결과를 제공하는 것으로 나타났다.


This study aims to suggest an effective way to enhance question-answer(QA) document retrieval performance by reconstructing queries based on the structural features in the QA documents. QA documents are a structured document which consists of three components: question from a questioner, short description on the question, answers chosen by the questioner. The study proposes the methods to reconstruct a new query using by two major structural parts, question and answer, and examines which component of a QA document could contribute to improve query performance. The major finding in this study is that to use answer document set is the most effective for reconstructing a new query. That is, queries reconstructed based on terms appeared on the answer document set provide the most relevant search results with reducing redundancy of retrieved documents.

이지원(대구가톨릭대학교) ; 김태수(연세대학교) 2005, Vol.22, No.1, pp.229-248 https://doi.org/10.3743/KOSIM.2005.22.1.229

이 연구에서는 접근점제어를 위한 국가적인 협력 모형을 전제로, 자관의 전거레코드를 별도로 구축운영하면서 서지레코드와 연결하는 방안 대신, 기 구축된 국가 접근점제어 레코드를 자관의 서지레코드와 바로 연계하여 활용할 수 있는 방안을 제시하였다. 이를 위하여 ZING(Z39.50 International: Next Generation)의 SRU (Search and Retrieve URL Service) 프로토콜을 적용하여 클라이언트/서버 시스템을 구축하였다. 이 연구에서 구축한 접근점제어 시스템은 로컬기관 전거제어 시스템 구축에 소요되는 비용과 시간을 절감할 수 있으며, 전거형 선정을 배제한 접근점제어 레코드의 이용, XML 레코드 형식 및 SRU 프로토콜의 도입을 통하여 기존 전거제어 협력 모형에 비해 보다 편리하고 융통성있게 활용될 수 있을 것이다.


This study proposes a national cooperative model of access point control, that enables local systems to utilize national access point control record, without creating their own authority records. In order to applying this model, a client/server system is developed using SRU (Search and Retrieve URL Service) protocol. The suggested access point control system will be a cost-effective and time-saving model for the local system, and will be more flexible and extensible with concept of access point control, XML record format and SRU protocol.

김성은(연세대학교) ; 이지연(연세대학교) 2013, Vol.30, No.4, pp.155-173 https://doi.org/10.3743/KOSIM.2013.30.4.155

본 연구는 청소년의 가상 정보 공간에서의 일상적인 활동을 위한 정보 이용 행태에 관해 살펴보았다. 기존의 물리적 정보 공간의 개념을 가상 정보 공간으로 확장하였고, 청소년 시기의 특징을 반영하여 다양한 일상적인 활동과 또래집단을 고려하였다. 이를 위하여 서울시 중고등학생을 대상으로 사전 면담 및 설문조사를 실시하였고, 청소년들의 가상 정보 공간과 정보 이용에 대한 양상을 분석하였다. 본 연구를 통해 학교도서관에서 청소년들을 위한 교육 프로그램 및 서비스 제공 시에 고려할 수 있는 시사점을 제안하였고, 추후 학교도서관에서의 정보 서비스 기획에 활용될 수 있을 것이다.


This study investigates the information use behavior of Korean youths in a virtual information grounds. The concept of a physical information ground is expanded to include virtual spaces. A variety of hobbies and peer groups of Korean youths are considered to determine the characteristics of these youths. The study was formulated and conducted using group interviews for pretest and a survey given to respondents who are junior high and high school students in Seoul. It is expected that the findings and proposals will be used for planning educational programs and information services in school libraries.


문헌간 유사도를 자질로 사용하는 분류기에서 미분류 문헌을 학습에 활용하여 분류 성능을 높이는 방안을 모색해보았다. 자동분류를 위해서 다량의 학습문헌을 수작업으로 확보하는 것은 많은 비용이 들기 때문에 미분류 문헌의 활용은 실용적인 면에서 중요하다. 미분류 문헌을 활용하는 준지도학습 알고리즘은 대부분 수작업으로 분류된 문헌을 학습데이터로 삼아서 미분류 문헌을 분류하는 첫 번째 단계와, 수작업으로 분류된 문헌과 자동으로 분류된 문헌을 모두 학습 데이터로 삼아서 분류기를 학습시키는 두 번째 단계로 구성된다. 이 논문에서는 문헌간 유사도 자질을 적용하는 상황을 고려하여 두 가지 준지도학습 알고리즘을 검토하였다. 이중에서 1단계 준지도학습 방식은 미분류 문헌을 문헌유사도 자질 생성에만 활용하므로 간단하며, 2단계 준지도학습 방식은 미분류 문헌을 문헌유사도 자질 생성과 함께 학습 예제로도 활용하는 알고리즘이다. 지지벡터기계와 나이브베이즈 분류기를 이용한 실험 결과, 두 가지 준지도학습 방식 모두 미분류 문헌을 활용하지 않는 지도학습 방식보다 높은 성능을 보이는 것으로 나타났다. 특히 실행효율을 고려한다면 제안된 1단계 준지도학습 방식이 미분류 문헌을 활용하여 분류 성능을 높일 수 있는 좋은 방안이라는 결론을 얻었다


This paper studies the problem of classifying documents with labeled and unlabeled learning data, especially with regards to using document similarity features. The problem of using unlabeled data is practically important because in many information systems obtaining training labels is expensive, while large quantities of unlabeled documents are readily available. There are two steps in general semi-supervised learning algorithm. First, it trains a classifier using the available labeled documents, and classifies the unlabeled documents. Then, it trains a new classifier using all the training documents which were labeled either manually or automatically. We suggested two types of semi-supervised learning algorithm with regards to using document similarity features. The one is one step semi-supervised learning which is using unlabeled documents only to generate document similarity features. And the other is two step semi-supervised learning which is using unlabeled documents as learning examples as well as similarity features. Experimental results, obtained using support vector machines and naive Bayes classifier, show that we can get improved performance with small labeled and large unlabeled documents then the performance of supervised learning which uses labeled-only data. When considering the efficiency of a classifier system, the one step semi-supervised learning algorithm which is suggested in this study could be a good solution for improving classification performance with unlabeled documents.


연구전선이란 연구논문들 간에 인용이 빈번하게 발생하며, 지속적으로 발전이 이루어지고 있는 연구영역을 의미한다. 연구행위가 집중되는 핵심 연구분야로 발전 가능성이 높은 연구전선을 조기에 예측해내는 것은 학계와 산업계, 정부기관, 나아가 국가의 과학기술 발전에 큰 유익을 가져다 줄 수 있는 유용한 사회적 자원이 된다. 본 연구는 복합자질을 활용하여 연구전선을 추론하는 모델을 제시하고자 시도하였다. 연구전선 추론은 핵심 연구영역으로 발전할 가능성이 높은 문헌들이 포함될 수 있도록 문헌을 복합자질로 표현하고, 그 자질들을 심층학습하여 새로 발행된 문헌들이 연구전선에 포함될 수 있는지 그 가능성을 예측하였다. 서지 자질, 네트워크 자질, 내용 자질 등 복합자질 세트를 사용하여 문헌을 표현하고 피인용을 많이 받을 가능성이 있는 문헌을 추론하기 위해서 확률기반 팩터그래프 모델을 적용하였다. 추출된 자질들은 팩터그래프의 변수로 표현되어 합-곱 알고리즘과 접합 트리 알고리즘을 적용하여 연구전선 추론이 이루어졌다. 팩터그래프 확률모델을 적용하여 연구전선을 추론․구축한 결과, 서지결합도 4 이상으로 구축된 베이스라인 연구전선과 큰 차이를 보였다. 팩터그래프 기반 연구전선그룹이 서지결합 기반 연구전선그룹보다 문헌 간의 직접 연결정도가 강하며 연결 관계에 있지 않은 두 개의 문헌을 연결시키는 매개정도 또한 강한 집단으로 나타났다.


This study attempts to infer research fronts using factor graph model based on heterogeneous features. The model suggested by this study infers research fronts having documents with the potential to be cited multiple times in the future. To this end, the documents are represented by bibliographic, network, and content features. Bibliographic features contain bibliographic information such as the number of authors, the number of institutions to which the authors belong, proceedings, the number of keywords the authors provide, funds, the number of references, the number of pages, and the journal impact factor. Network features include degree centrality, betweenness, and closeness among the document network. Content features include keywords from the title and abstract using keyphrase extraction techniques. The model learns these features of a publication and infers whether the document would be an RF using sum-product algorithm and junction tree algorithm on a factor graph. We experimentally demonstrate that when predicting RFs, the FG predicted more densely connected documents than those predicted by RFs constructed using a traditional bibliometric approach. Our results also indicate that FG-predicted documents exhibit stronger degrees of centrality and betweenness among RFs.
