
본문 바로가기 주메뉴 바로가기

ACOMS+ 및 학술지 리포지터리 설명회

  • 한국과학기술정보연구원(KISTI) 서울분원 대회의실(별관 3층)
  • 2024년 07월 03일(수) 13:30


검색어: : Information Retrieval, 검색결과: 99
변영태(홍익대학교) ; 황상규(홍익대학교) ; 정찬기(국방대학교) 2010, Vol.27, No.4, pp.33-47 https://doi.org/10.3743/KOSIM.2010.27.4.033

정보기술혁명 및 네트워크 기반 정보공유 대중화는 국방 분야 디지털콘텐츠 수를 증가시켰다. 이에 따라 급격하게 그 수가 증가한 장기 보존된 디지털화된 공공정보 가운데 사용자 본인에게 적합한 공공정보를 찾는 것은 매우 중요한 문제로 대두되고 있다. 디지털콘텐츠는 원 자료의 출처 및 생산 시기에 따라 그 형태가 매우 다양하고, 디지털콘텐츠 간에는 많은 상호 연관 관계가 존재한다. 비즈니스 서비스 온톨로지는 공공분야 디지털 아카이브 정보 생산자와 정보 이용자 간의 상호 지식을 명시화하고 지식을 공유할 수 있는 방안을 제공함으로써 디지털 공공정보 검색능력을 증진시키는데 많은 도움을 줄 수 있다. 비즈니스 서비스 온톨로지는 정보 생산자와 정보 이용자 간의 교량과 같은 인터페이스 역할을 수행하는 것이다. 그러나 업무 처리절차에 대한 의미 지식 추출의 어려움으로 인하여, 비정형의 업무 활동들로부터 정형화된 비즈니스 서비스로의 매핑 정보를 제공하는 비즈니스 서비스 온톨로지 자동화는 실용화하기가 매우 힘든 실정이다. 이러한 문제점을 해결하고자 본 연구에서는 비즈니스 서비스 온톨로지 구축을 위한 첫 단계로써 전사적 아키텍처(ITA/EA)로부터 단위 비즈니스 서비스 식별 자동화 방안을 제안한다.


The growth of IT technology and the popularity of network based information sharing increase the number of digital contents in military area. Thus, there arise issues of finding suitable public information with the growing number of long-term preservation of digital public information. According to the source of raw data and the time of compilation may be variable and there can be existed in many correlations about digital contents. The business service ontology makes knowledge explicit and allows for knowledge sharing among information provider and information consumer for public digital archive engaged in improving the searching ability of digital public information. The business service ontology is at the interface as a bridge between information provider and information consumer. However, according to the difficulty of semantic knowledge extraction for the business process analysis, it is hard to realize the automation of constructing business service ontology for mapping from unformed activities to a unit of business service. To solve the problem, we propose a new business service auto-acquisition method for the first step of constructing a business service ontology based on Enterprise Architecture.



Emerging Web 2.0 services such as Twitter, Blogs, and Wikis alongside the poorly- structured and immeasurable growth of information requires an enhanced information organization approach. Ontology has received much attention over the last 10 years as an emerging approach for enhancing information organization. However, there is little penetration into current systems. The purpose of this study is to propose ontology implementation and methodology. To achieve the goal of this study, limitations of traditional information organization approaches are addressed and emerging information organization approaches are presented. Two ontology data models, RDF/OW and Topic Maps, are compared and then ontology development processes and methodology with topic maps based medical information retrieval system are addressed. The comparison of two data models allows users to choose the right model for ontology development.


본 연구에서는 웹 환경에서의 학습 방법이 학생들의 정보검색 및 정보종합 능력에 어떠한 영향을 미치는가를 규명하고자 하였다. 본 연구의 결과는 다음과 같다. 첫째, 과제 중심형 학습 집단이 기법 중심형 학습 집단보다 정보검색 능력 중 정보성취도 검사점수가 높게 나타났으며, 통계적으로 유의미한 차이를 보였다 (t=3.59, p〈.05). 둘째, 네이버 국내 웹 1차 검색 (재현율 t=1.81, 정확율 t=.61)에서 과제 중심형 학습 집단과 기법 중심형 학습 집단간에 재현율과 정확율 모두 유의미한 차이가 없었다 (p〉.05). 그러나 2차 검색 (재현율 t=2.93, 정확율 t=2.45)과 3차 검색 (재현율 t=3.48, 정확율 t=2.50)에서는 과제중심형 학습 집단이 기법 중심형 학습 집단보다 재현율과 정확율이 높게 나타났으며, 통계적으로 유의미한 차이를 보였다 (p〈.05). 셋째, 과제 중심형 학습 집단과 기법 중심형 학습 집단은 정보종합 능력의 검사 점수 차이가 통계적으로 유의미하지 않았다 (t=1.95, p〉.05). 위 실험 결과를 종합해 보면, 인터넷에서 정보를 검색하는 경우에 과제에 대한 분석과 그에 알맞는 정보검색 기법을 적용하는 것이 중요하다. 기법에 의존하기보다는 과제를 분석하고 그에 알맞는 검색을 수행해야 한다. 또 정보 이용 교육이 정보검색 수준에서 머무르는 것이 아니라, 정보검색과 정보종합에 관한 교육이 정보 문제 해결의 맥락에서 이루어져야 할 것이다.


The purpose of this study is to investigate the effects of learning methods on students'''' information retrieval and information synthesis capability in web. This is an experimental study comparing the two different learning methods as task-based learning and technic-based learning. The findings of this study were as follows: 1. The task-based learning was more effective than the technic-based learning in information achievements as information retrieval capability (t= 3.59, p〈.05). 2. In the 1st retrieval (recall ratio t=1.81 precision ratio t=.61) of Naver Korean Web Retrieval, there was no significant difference (p〉.05). In the 2nd retrieval (recall ratio t=2.93 precision ratio t=2.45) and 3rd retrieval (recall ratio t=3.48 precision ratio t= 2.50), the task-based group was more effective than the technic-based group (p〈.05). 3. There was no significant difference in students'''' information synthesis capability between the task-based learning and technic-based learning (t= 1.95, p〉.05). The findings of this study suggest that the task-based learning approach is more effective to improve students'''' information literacy, and that professionals should consider better instructional principles for the improvement of instructional quality.

이보은(연세대학교 문헌정보학과) ; 이지연(연세대학교) 2019, Vol.36, No.1, pp.95-116 https://doi.org/10.3743/KOSIM.2019.36.1.095

본 연구에서는 학술정보검색에 있어 국내 대학생과 대학원생들이 외국어 탐색문을 어떻게 활용하는지, 그리고 이용자의 특성에 따라 외국어 탐색문의 활용도에 차이가 나타나는지 파악하고자 하였다. 연구 모형은 Ellis의 정보탐색과정 모형을 바탕으로 설계되었으며, 실험, 인터뷰, 통계분석 등 양적․질적인 연구방법을 모두 활용하였다. 연구 결과, 학술정보검색의 각 단계에서 국문 검색 전략과는 다른 다양한 외국어 검색 전략들이 발견되었고, 이러한 검색 전략들은 특히 이용자의 전공분야와 학력에 따라 차이를 보이는 것으로 파악되었다. 특히 인문․사회과학분야 피실험자들이 과학기술분야 피실험자들에 비해 외국어 탐색문을 선정하는 데 큰 어려움을 겪으며, 이에 따라 외국어를 활용한 검색을 선호하지 않는 점을 확인하였다. 또한 외국어 학술정보검색에서 인용정보나 발행지 정보 등 본문 이외의 정보들에 대한 의존도가 높아지는 모습을 보였다. 결과적으로 이용자의 특성에 따라 학술정보검색 과정에 외국어를 활용하는 비중이나 느끼는 어려움의 정도에 차이가 존재한다는 점을 파악할 수 있었으며, 향후 대학도서관은 이러한 이용자의 특성에 맞추어 이용자교육이나 도서관 서비스를 제공할 수 있을 것이다.


This study focused on understanding the Korean university students’ (both undergraduates and graduates) use of foreign language for scholarly information retrieval especially in different search strategies employed based on users’ characteristics. A new model was developed based on Ellis’s behavioral model of information seeking strategies. The research applied both quantitative and qualitative methods to analyze the data. The students used a variety of foreign language information seeking strategies at different stages of academic information retrieval based on his/her field of study or level of education. The liberal arts and social science students had more difficulty in selecting proper search terms in the foreign language than the science and technology students. This difficulty resulted in less preference for using foreign language queries by the liberal arts and social science students. The students relied more on the bibliographic and citation information in scholarly information retrieval using foreign language queries than the Korean queries. The research outcomes should provide some guidelines on how the Korean university libraries offer information literacy programs and other services based on the patrons’ characteristics.


본 연구에서는 셀프 아카이빙(self-archiving)을 기본으로 메타데이터가 구축되는 기관 리포지터리의 인명 검색 문제점을 해결하고자, 인명 접근점제어 데이터를 구축하였다. 이를 위해 기존 도서관의 전거데이터를 활용하면서도 전거형을 인정하지 않고, 정보원에 기재된 형식을 모두 접근점으로 사용하는 그룹화 방법을 사용하고, 동명이인 처리를 위해 저작자의 주제분야와 저작정보를 확장해서 사용하는 새로운 방법을 토대로 인명 접근점제어 데이터를 구축하고 시스템에 적용하여 검색의 기능이 향상되었다. 향후 기관 리포지터리 외에 도서관이 총괄하는 모든 메타데이터의 검색 기능 향상을 위해서도 활용할 수 있을 것이다.


This study developed a name access point control system for better performance of information retrieval from institutional repositories, which are equipped with author- generated metadata processes for self-archiving. In developing name access point control data for the system, the primary data were created from the existing authority. However, unlike the existing authority data, the primary data did not use any authority forms. Instead, the data utilized all the forms provided by the resources as access points. Specifically, field of activity(subject) and title information on authorship were used to distinguish between persons who have the same name. The result showed that the system improved the performance of the information retrieval. The system has been also expected to be utilized over other metadata provided by libraries, in addition to the institutional repositories, in order to provide better quality information.


사용자는 원하는 자료를 검색하기 위해서 각 위치에 대한 정보를 저장하고 있는 검색엔진을 이용하는 경우가 대부분이다. 하지만 자료의 양이 방대해 짐에 따라 사용자에게 실제로 필요한 정보가 아닐 경우가 많이 발생한다. 본 논문에서는 이러한 문제를 해결할 수 있는 개인형 릴 인터페이스 에이전트 시스템인 7f 가이드를 제안하였다. 웹 가이드는 사용자의 행동과 에이전트의 방문을 키워드를 중심으로 각각의 사례로 저장하는 사례기반 학습 방법을 이용, 특징 개인 사용자가 웹 상에서 검색하고자 하는 자료를 입력받은 후부터 사용자의 방문 행동을 학습하여 보다 빠른 시간 내에 원하고자 하는 자료를 검색할 수 있도록 도와주는 에이전트 시스템이다.


Users usually search for the required information via search engines which contain locations of the information. However. as the amount of data gets large, the result of the search is often not the information that users actually want. In this paper a web guide is proposed in order to resolve this problem. The web guide uses case-based learning method which stores and utilizes cases based on the keywords of user's action and agent's visit. The proposed agent system learns the user's visiting actions following the input of the data to be searched, and then helps rapid searches of the data wanted.


이 연구의 목적은 대량의 최신정보를 제공하는 정보필터링 시스템에서 이용자 피드백에 의해 수정질의를 자동생성하여 재검색을 수행함으로써 검색 성능을 최적화할 수 있는 방안을 찾는 데 있다. 이용자가 입력한 초기질의를 사용하여 정보필터링 시스템이 검색한 문헌에 대해 이용자가 적합성 여부를 온라인으로 입력하도록 하고, 이 피드백 결과를 토대로 '중복제거법'과 '저빈도제거법' 두 가지 방법에 의해각각 17개의 수정질의를 생성하여 재검색한 결과를 초기 검색결과와 비교 분석하였다. 수정질의는 각각의 방법마다 17개 패턴의 불논리 질의형태를 미리 만든 다음 초기질의에 디스크립터와 분류기호를 결합하여 생성하였으며, 재검색 결과에 대한 적합성 평가를 통해 최적의 수정질의식을 도출하였다.


In this study an information filtering system was implemented and a series of relevance feedback experiments were conducted using the system. For the relevance feedback, the original queries were searched against the database and the results were reviewed by the researchers. Based on users' online relevance judgements a pair of 17 refined queries were generated using two methods called "co-occurrence exclusion method" and "lower frequencies exclusion method." In order to generate them, the original queries. the descriptors and category codes appeared in either relevant or irrelevant document sets were applied as elements. Users' relevance judgments on the search results of the refined queries were compared and analyzed against those of the original queries. [ 더 많은 내용 보기 ]



With the purpose of enriching existing catalogues with FRBR, which is the Functional Requirements for Bibliographic Records, in mind, this paper aims to evaluate the impact of bibliographic ontology on the overall system’s performance in the field of literature. In doing this, OCLC’s FictionFinder (http://fictionfinder.oclc.org) was selected and qualitatively evaluated. In this study 40 university seniors evaluated the following three aspects using the ‘transferring thoughts onto paper method’: 1) In which ways is this FRBR-aware bibliographical ontology helpful? 2) Are the things which are initially attempted to be helped being helped? 3) Would users seeking one work in particular also see all other related works? In conclusion, this study revealed that, as Cutter claimed in his 2nd rule of the library, collocations give added-value to the users and overall ontology provides better interface and usefulness. It also revealed that a system’s evaluation with qualitative methodology helped to build full pictures of the system and to grip the information needs of the users when the system is developed. Qualitative evaluations, therefore, could be used as indicators for the evaluation of any information retrieval systems.

백우진(건국대학교) ; Sun-Eun Jung(Konkuk U) ; Euigun Ahn(Yonsei U) ; 김기용(건국대학교) ; 신문선(건국대학교) 2008, Vol.25, No.2, pp.49-68 https://doi.org/10.3743/KOSIM.2008.25.2.049


In many information retrieval experiments, the data fusion techniques have been used to achieve higher effectiveness in comparison to the single evidence-based retrieval. However, there had not been many image retrieval studies using the data fusion techniques especially in combining retrieval results based on multiple retrieval methods. In this paper, we describe how the image retrieval effectiveness can be improved by combining two sets of the retrieval results using the Sobel operator-based edge detection and the Self Organizing Map(SOM) algorithms. We used the clip art images from a commercial collection to develop a test data set. The main advantage of using this type of the data set was the clear cut relevance judgment, which did not require any human interven- tion.


최근 다양한 주제 분야의 블로그가 이용자의 정보요구를 충족시켜주는 웹 정보원 중 하나로 활용되고 있다. 본 연구에서는 블로그 페이지의 검색 성능을 향상시키기 위하여 이용자가 부여한 태그 및 트랙백을 이용하여 블로그 페이지의 검색 실험을 수행하였다. 실험을 위해 4,908개의 블로그 페이지와 각 페이지에 트랙백으로 연결된 다른 블로그 페이지의 URL을 수집하였다. 검색 자질로 본문의 용어에 이용자 태그를 추가하였을 경우와 네트워크 중심성 값을 반영하였을 경우 모두 검색 성능이 향상되었고, 본문 용어와 이용자 태그를 검색 자질로 함께 사용하고 여기에 중심성 값을 반영하였을 경우 가장 좋은 성능을 보였다.


Blogs are now one of the major information resources on the web. The purpose of this study is to enhance the performance of blog retrieval by means of user assigned tags and trackback information. To this end, retrieval experiments were performed with a dataset of 4,908 blog pages together with their associated trackback URLs. In the experiments, text terms, user tags, and network centrality values based on trackbacks were variously combined as retrieval features. The experimental results showed that employing user tags and network centrality values as retrieval features in addition to text words could improve the performance of blog retrieval.
