
본문 바로가기 주메뉴 바로가기

ACOMS+ 및 학술지 리포지터리 설명회

  • 한국과학기술정보연구원(KISTI) 서울분원 대회의실(별관 3층)
  • 2024년 07월 03일(수) 13:30


검색어: : Information Retrieval, 검색결과: 99


In recent years, the changes in information technology have been so dramatic and the rate of changes has increased so much that information science research rigorously evolves with the passage of time and proliferates in diverging research directions dynamically. The aims of this study are to provide a global overview of research trends in information science and to trace its changes in the main topics over time. The study examined the topics of research articles published in JASIST between 1985 and 2009 and identified its changes during five 5 year periods. The study found that the most productive area has consistently been ‘Information Retrieval’, followed by ‘Informetrics’, ‘Information Use and Users’, ‘Network and Technology’, and ‘Publishing and Services’. Information retrieval is a predominant core area in Information Science covering computer-based handling of multimedia information, employment of new semantic methods from other disciplines, and mass information handling on virtual environments. Currently Informetric studies shift from finding existing phenomena to seeking valuable descriptive results and researchers of information use have concentrated especially on information-seeking aspects, so adding greater sophistication to the relatively simple approach taken in information retrieval.



The ability of the searcher to express their information problem to an information retrieval system is fundamental to the retrieval process. Query by visual example is the principal query paradigm for expressing queries in a content-based image retrieval environment yet there is little empirical evidence to support its efficacy in facilitating query formulation. The aim of this research was to investigate the usability of the query by colour method in supporting a range of information problems in order to contribute to the gap in knowledge regarding the relationship between searchers’ information problems and the query methods required to support efficient and effective visual query formulation. The results strongly suggest that the query method does not support visual query formulation and that there is a significant mismatch between the searchers information problems and the expressive power of the retrieval paradigm.

강남규(한국과학기술정보연구원) ; 이석형(한국기업평가(주)) ; 이응봉(충남대학교) 2002, Vol.19, No.3, pp.91-110 https://doi.org/10.3743/KOSIM.2002.19.3.091

최근, 키워드 기반의 정보검색의 한계를 극복하기 위한 구조문서 기반의 연구가 활발하게 진행되고 있지만, 실제 적용에는 많은 어려움이 존재한다. 본 고에서는 구조문서에 대한 본문검색시스템을 제안한다. 본문검색시스템에 적용된 문서는 XML로 구축된 국가연구개발 보고서를 대상으로 하였으며, XML 연구보고서의 DTD, 본문 간의 이동을 위한 네비게이션 정보추출, 본문검색을 위한 검색엔진의 적용 방안에 관하여 살펴본다. 본 시스템은 XML 문서에 대해 문서의 구조정보를 저장하고 이를 검색하여 다양한 형태로 열람할 수 있는 검색 엔진의 부재 상황을 본문검색이라는 방법으로 극복하기 위한 것이다.


Recently, to overcome the limit of keyword based retrieval system, the study based structured document has been studied. But it is hard for structured retrieval system to adapt a real service, in this paper, we propose a method of retrieval mechanism for the ful-text of XML documents. We explain DTD of XML based report, extracting navigation information and planing to adapt the retrieval system for article retrieval. Using the fulltext retrieval scheme, suggested system can be an alternative plan of professional structured based retrieval system.

서은경(한성대학교) ; 박미향() 2009, Vol.26, No.2, pp.173-194 https://doi.org/10.3743/KOSIM.2009.26.2.173


Recently, semantic search techniques which are based on information space as consisting of non- ambiguous, non-redundant, formal pieces of ontological knowledge have been developed so that users do exploit large knowledge bases. The purpose of the study is to design more user-friendly and smarter retrieval interface based on ontological analysis, which can provide more precise information by reducing semantic ambiguity or more rich linked information based on well-defined relationships. Therefore, this study, first of all, focuses on ontological analysis on researcher information as selecting descriptive elements, defining classes and properties of descriptive elements, and identifying relationships between the properties and their restriction between relationships. Next, the study designs the prototypical retrieval interface based on ontology-based representation, which supports to semantic searching and browsing regarding researchers as a full-fledged domain. On the proposed retrieval interface, users can search various facts for researcher information such as research outputs or the personal information, or carrier history and browse the social connection of the researchers such as researcher group that is lecturing or researching on the same subject or involving in the same intellectual communication.


본 연구에서는 주요 검색 포털들의 검색어 추천 서비스를 분석, 평가하였다. 이 연구에서는 네이버와 구글 코리아를 대상으로 추천되는 연관 검색어의 적합도 및 최신성을 평가하고, 연관 검색어의 개수 및 분포, 연관 검색어가 제공되지 않는 질의의 특징을 조사하였다. 또한 연관 검색어의 유형을 질의와 연관 검색어의 관계 측면에서 분석하고, 연관 검색어들 중 유해 검색어의 유형 및 특징, 비표준어의 유형 및 특징도 조사하였다. 마지막으로, 한글 질의와 영어 질의, 대중적인 질의와 전문적인 질의의 연관 검색어의 특징을 비교하였다. 연구 결과, 네이버가 구글보다 연관 검색어의 적합도와 최신성이 다소 높은 것으로 나타났다. 또한 구글과 네이버 모두 새로운 연관 검색어를 제시하기보다는 질의에 단어를 추가 또는 삭제하거나, 질의와 동일한 검색어나 동의어 검색어를 제공하는 경우가 많은 것으로 나타났다. 본 연구의 결과는 향후 포털들의 검색어 추천 서비스의 개선에 활용될 수 있을 것으로 기대된다.


This study aims to analyze and evaluate term suggestion services of major search portals, Naver and Google Korea. In particular, this study evaluated relevance and currency of related search terms provided, and analyzed characteristics such as number and distribution of terms, and queries that did not produce terms. This study also analyzed types of terms in terms of the relationship between queries and terms, and investigated types and characteristics of harmful terms and terms with grammatical errors. Finally, Korean queries and English queries, and popular queries and academic queries were compared in terms of the amount and relevance of search terms provided. The results of this study show that the relevance and currency of Naver's related search terms are somewhat higher than those of Google. Both Naver and Google tend to add terms to or delete terms from original queries, and provide identical search terms or synonym terms rather than providing entirely new search terms. The results of this study can be implemented to the portal's effective development of term suggestion services.



This study constructed an ontology targeting journal articles and evaluated its performance. Also, the performance of a triple structure ontology was compared with the knowledge base of an inverted index file designed for a simple keyword search engine. The coverage was three years of articles published in the Journal of the Korean Society for Information Management from 2007 to 2009. Protégé was used to construct an ontology, whilst utilizing an inverted index file to compare performance. The concept ontology was manually established, and the bibliography ontology was automatically constructed to produce an OWL concept ontology and an OWL bibliography ontology, respectively. This study compared the performance of the knowledge base of the ontology, using the Jena search engine with the performance of an inverted index file using the Lucene search engine. As a result, The Lucene showed higher precision rate, but Jena showed higher recall rate.

유소영(연세대학교) ; 문성빈(연세대학교) 2004, Vol.21, No.4, pp.187-208 https://doi.org/10.3743/KOSIM.2004.21.4.187

이 연구에서는 심미적 인상을 이미지 검색의 고수준 자질로 이용하였다. ‘심미적’이라는 용어는 심리학, 예술, 문학 등에서 연구되어 왔다. 이 용어는 시각적 지각과 감정의 무의식적이고 즉각적인 측면을 의미한다. 심미적 인상과 관련된 문헌 연구를 통해 4 가지 종류의 심미적 인상을 조작적으로 정의하였다: 강한 인상, 부드러운 인상, 중후한 인상, 세련된 인상. 66개의 회화 이미지 파일을 1,000개의 회화 이미지 중에서 무작위로 추출하였으며 시지각 색상 모형을 이용하여 이 이미지 파일들로부터 저수준 색상 자질을 추출하였다. 이미지의 고수준 자질인 4가지 종류의 심미적 인상은 4명의 평가자가 리커트 7점 척도로 평가한 것을 평균내었다. 검색 실험에서 2명의 피험자는 심미적 인상이나 주제어에 대한 예제 이미지 질의를 이용해서 이미지 검색을 수행하였다. 피험자들은 심미적 인상 기반 이미지 검색 시스템에 대해서 보통 정도의 수준으로 만족했다. 그리고 색상 자질과 심미적 인상 자질을 모두 이용한 이미지 검색의 R-정확률이 색상 자질만을 이용한 이미지 검색의 R-정확률보다 높았다. 그러나 이 연구결과의 일반화를 위해서는 큰 실험 집단을 대상으로 보다 많은 검색 질의를 통한 추후 연구들이 필요할 것으로 생각된다.


In this study, aesthetic impressions were used for a high-level feature of image retrieval. The term, “aesthetic" has been studied in psychology, art, and literature. It means unconscious, instantaneous parts of visual perception and emotion. The literatures related to aesthetic impressions were reviewed and four kinds of aesthetic impressions were defined operationally: strong impression, soft impression, courteous impression, and refined impression. 66 image files of paintings were sampled randomly from 1100 paintings and low-level color features were extracted from them by a using perceptual color model(Lai, & Tait, 1998). The high-level features of an image, that is, four kinds of aesthetic impressions of each painting were measured by 4 subjects and averaged. In CBIR, 2 subjects performed image retrievals using example queries. They were asked to retrieve images by using the aesthetic impressions or the keywords. In evaluations, subjects showed that they were satisfied with the aesthetic impression-based image retrieval system on the average. And R-precision of the image retrieval with both color features and aesthetic impressions was higher than that of the image retrieval with color features only. But further studies with larger test collections and query sets should be followed for generalization of the result of this study.


인터넷 정보검색과정에서 가장 보편적으로 사용되고 있는 검색방법은 키워드 검색이다. 키워드 검색은 정확률과 재현율의 관점에서 여러가지 단점을 지니고 있다. 이러한 키워드 검색의 단점을 보완해 줄 수 있는 장치로서 다수의 웹 포털에서 디렉토리 검색서비스를 제공하고 있다. 검색포털에서 제공하고 있는 디렉토리 서비스는 포털별로 상이한 분류체계를 사용하는 이유로 이용자에게 불편을 주고 있으며, 이러한 불편의 해소를 위해 디렉토리 서비스간 통합검색을 제공하는 중개 게이트웨이의 구축필요성이 제기되고 있다. 이에 따라 이 연구에서는 네이버, 야후, 엠파스 등 국내 주요 포털의 디렉토리 서비스를 대상으로 통합검색을 제공하는 중개 게이트웨이의 모형을 구축하고 그 성능을 평가하였다.


The most widely used information searching method in the current internet environment is the keyword-based one, which has certain limitations in terms of precision and recall. Most major internet portals provide directory-based searching as a means to complement these limitations. However, that they adopt different classification schemes brings significant inconvenience to the users, and it consequently suggests a need to develop mapping gateway to provide cross-portal, or cross-directory information searching. In this context, this study attempts to develop a prototype system of intermediary gateway for integrated search, using the directory services of three major portals, Naver, Yahoo and Empas, and test its performance.


역문헌빈도 가중치 기법은 문헌 집단에서 출현빈도가 낮을수록 색인어의 중요도가 높다는 가정에 근거하고 있다. 그런데 이는 중간빈도어를 중요하게 여기는 여타 이론과는 일치하지 않는 것이다. 이 연구에서는 저빈도어보다 중간빈도어가 더 중요하다는 가정에 근거하여 역문헌빈도 가중치 공식을 수정한 피벗 역문헌빈도 가중치 기법을 제안하였다. 제안된 기법을 검증하기 위해서 세 실험집단을 대상으로 검색실험을 수행한 결과. 피벗 역문헌빈도 가중치기법이 역문헌빈도 가중치 기법에 비해서 특히 검색결과 상위에서의 성능을 향상시키는 것으로 나타났다.


The Inverse Document Frequency (IDF) weighting method is based on the hypothesis that in the document collection the lower the frequency of a term is, the more important the term is as a subject word. This well-known hypothesis is, however, somewhat questionable because some low frequency terms turn out to be insufficient subject words. This study suggests the pivoted IDF weighting method for better retrieval effectiveness, on the assumption that medium frequency terms are more important than low frequency terms. We thoroughly evaluated this method on three test collections and it showed performance improvements especially at high ranks.


본 연구는 한국 통합 검색 환경에서의 이용자 적합성 판단 기준에 관한 탐색적 연구이다. 이를 위해 10명의 참가자들을 대상으로 반구조화(semi-structured) 인터뷰를 수행하여 데이터를 수집하였다. 참가자들은 네이버, 다음 등과 같은 통합 검색 환경에서 본인들이 관심 있거나 필요로 하는 다양한 검색을 수행하고, 그 과정에서 문서가 적합한지와 그 판단 기준에 대해 기술하였다. 연구 결과 8개의 적합성 판단 기준과 비적합성 판단 기준, 그리고 검색 환경이 변화하여도 이용자가 적합성을 판단하는 기준들이 크게 변화하지는 않지만 데이터 증가와 이용자 요구의 고도화로 특수성과 구체성이 중요한 적합성 판단 기준으로 부각되는 점을 발견하였다.


This study is an exploratory research on the user relevance criteria in Korean search service environments that provide integrated search results. Data were collected from 10 participants using a semi-structured interview technique. The participants conducted a web search using integrated search services, such as Naver or Daum on a self-selected topic. They were asked to judge the relevance of retrieved documents and to report their relevance criteria. As a result, the research indicated 8 user-defined relevance and non-relevance criteria. The research shows that specificity and richness are the two most important criteria yet, the user’s relevance criteria have not changed much despite the change in search environment.
