바로가기메뉴

본문 바로가기 주메뉴 바로가기

logo

인접한 단어와 키워드 주제어 정보에 기반한 유사 문헌 검색 시스템 개발

Development of Similar Bibliographic Retrieval System based on Neighboring Words and Keyword Topic Information

한국도서관·정보학회지 / Journal of Korean Library and Information Science Society, (P)2466-2542;
2009, v.40 no.3, pp.367-387
https://doi.org/10.16981/kliss.40.3.200909.367
김광영 (한국과학기술정보연구원)
곽승진 (충남대학교)
  • 다운로드 수
  • 조회수

초록

유사 문헌 검색 시스템은 추출된 색인어 중에서 어떤 것을 선택하는가에 따라 검색 결과에 많은 차이점이 발생한다. 본 연구에서는 추출된 후보 색인어의 선정의 오류를 최소한으로 하는 방법을 제공한다. 본 연구에서는 유사 문헌에서 추출된 후보 색인어들을 이용하여 인접한 단어들의 정보와 추출된 키워드 주제어 정보를 이용하였다. 그리고 관련 저자들 정보와 검색 결과의 재순위화 방법을 이용하여 보다 정확도가 높은 유사 문헌 검색 시스템을 개발하였다. 본 논문에서는 과학기술 학회마을 데이터베이스를 이용하여 실험하였다. 실험과 사용자 평가를 통해서 유사 문헌 검색 시스템의 성능을 입증하였다.

keywords
Information Retrieval, Information Retrieval System, Topic Information, Similar Document, Weight, 정보 검색, 정보 검색 시스템, 주제어, 유사 문서, 가중치, Information Retrieval, Information Retrieval System, Topic Information, Similar Document, Weight

Abstract

The similar bibliographic retrieval system follows whether it selects a thing of the extracted index term and or not the difference in which the similar document retrieval system There be many in the search result is generated. In this research, the method minimally making the error of the selection of the extracted candidate index term is provided In this research, the word information in which it is adjacent by using candidate index terms extracted from the similar literature and the keyword topic information were used. And by using the related author information and the reranking method of the search result, the similar bibliographic system in which an accuracy is high was developed. In this paper, we conducted experiments for similar bibliographic retrieval system on a collection of Korean journal articles of science and technology arena. The performance of similar bibliographic retrieval system was proved through an experiment and user evaluation.

keywords
Information Retrieval, Information Retrieval System, Topic Information, Similar Document, Weight, 정보 검색, 정보 검색 시스템, 주제어, 유사 문서, 가중치, Information Retrieval, Information Retrieval System, Topic Information, Similar Document, Weight

참고문헌

1.

장성호, 강승식, “용어 선별 기법에 의한 유사 문서 판별 시스템,” 한국정보과학회학술지, 제30권, 제1호(2003), pp.534-536.

2.

KISTI 과학기술학회마을 홈페이지, <http://society.kisti.re.kr/> [cited 2009. 08. 19].

3.

박수용 등, “유사도 측정 기법을 이용한 효율적인 요구 분석 지원 시스템의 구현,” 한국정보과학회논문지, 제27권, 제1호(2000), pp.13-23.

4.

Baker, McCallum, “Distributional Clustering of Words for Text Classification,” Proceedings of SIGIR (1998), pp.96-103.

5.

정준호, 김미진, “문서 요약 시스템을 위한 수사 구조 트리 생성,” 한국정보과학회논문지, 제26권, 제2호(1999), pp.175-177.

6.

Hajime, Takeo, Manbu, “Text Segmentation with Multiple Surface Linguistic Cues,” Proceedings of the COLING-ACL(1998), pp.881-885.

7.

김혜숙, “단어/단어쌍 특징과 신경망을 이용한 두 문서간의 유사도 측정,” 한국정보과학회논문지, 제31권, 제12호(2004), pp.1660-1671.

8.

안희국, 노희영, “문서 분류를 위한 문장 응집도와 주어 주도의 주제어 추출,” 한국정보과학회, 한국컴퓨터종합학술대회 논문집, 제32권, 제1(B)호(2005), pp.463-465.

한국도서관·정보학회지