바로가기메뉴

본문 바로가기 주메뉴 바로가기

logo

자동분류 알고리즘을 이용한 지능형 정보검색시스템 구축에 관한 연구

A Study of Designing the Intelligent Information Retrieval System by Automatic Classification Algorithm

한국도서관·정보학회지 / Journal of Korean Library and Information Science Society, (P)2466-2542;
2008, v.39 no.4, pp.283-304
https://doi.org/10.16981/kliss.39.4.200812.283
서휘 (창원문성대학)
  • 다운로드 수
  • 조회수

초록

본 연구의 목적은 이용자의 탐색 행태, 시스템의 정보 구축 행태를 기반으로 초기 질의어의 범주에 해당하는 연관 용어들(해당 용어의 지식구조와 관련된 연관 용어들)을 학습기능을 통해 자동으로 제시해 줄 수 있는 지능형 검색 시스템을 구현하는 것이다. 이를 위해 학습을 통해 전문가 수준의 색인어를 추출할 수 있는 지능형자동색인 알고리즘, 자동분류에 관련한 클러스터링 알고리즘과 문서 범주화 알고리즘 그리고 범주 표현 알고리즘에 대한 이론적 연구를 수행하였으며, 이들 이론적 연구를 근거로 비용과 시간적인 측면에서 그리고 재현율과 정도율이란 측면에서 우수한 성능을 발휘할 수 있는 지능형검색시스템을 구현하였다.

keywords
자동색인 알고리즘, 자동분류 알고리즘, 범주 표현 알고리즘, 자동정보검색 알고리즘, 지능형 정보검색 시스템, Automatic Indexing Algorithm, Automatic Categorization Algorithm, Category Representation Algorithm, Automatic Information Algorithm, Intelligent Information Retrieval Algorithm, Automatic Indexing Algorithm, Automatic Categorization Algorithm, Category Representation Algorithm, Automatic Information Algorithm, Intelligent Information Retrieval Algorithm

Abstract

This is to develop Intelligent Retrieval System which can automatically present early query's category terms(association terms connected with knowledge structure of relevant terminology) through learning function and it changes searching form automatically and runs it with association terms. For the reason, this theoretical study of Intelligent Automatic Indexing System abstracts expert's index term through learning and clustering algorism about automatic classification, text mining(categorization), and document category representation. It also demonstrates a good capacity in the aspects of expense, time, recall ratio, and precision ratio.

keywords
자동색인 알고리즘, 자동분류 알고리즘, 범주 표현 알고리즘, 자동정보검색 알고리즘, 지능형 정보검색 시스템, Automatic Indexing Algorithm, Automatic Categorization Algorithm, Category Representation Algorithm, Automatic Information Algorithm, Intelligent Information Retrieval Algorithm, Automatic Indexing Algorithm, Automatic Categorization Algorithm, Category Representation Algorithm, Automatic Information Algorithm, Intelligent Information Retrieval Algorithm

참고문헌

1.

강승식, (2004) 한글 문서의 색인어와 색인 기법, 정보과학회지

2.

서휘, (1999) 클러스터링을 이용한 시소러스 브라우저의 설계에 관한 이론적 연구, 한국도서관정보학회지

3.

서휘, (2000) 자동정보검색을 위한 한글 시소러스 브라우저 구축에 관한 연구, 한국도서관정보학회지

4.

서휘, (2001) 자연어를 이용한 자동정보검색시스템 구축에 관한 연구, 한국문헌정보학회지

5.

강현규, (2002) 개념 검색어 확장을 통해 질의 형식화를 도와주는 개념 마법사의 설계 및 구현, 정보처리학회논문지

6.

F. Sebastiani, (2002) Machine learning in automated text categorization, ACM Computing Surveys

7.

심경, (2006) 문헌범주화에서 학습문헌수 최적화에 관한 연구, 정보관리학회지

8.

Dumais, Susan, (2008) “Inductive learning algorithms and representations for text categorization," Proceedings of ACM-CIKM 1998. pp.148-155.(online). <http://research.microsoft.com/~sdumais/cikm98.doc> [cited 2008. 10. 29],

9.

정영미, (2000) SVM분류기를 이용한 문서 범주화 연구, 정보관리학회지

10.

Peter, Jakson, Natural Language Processing for Online Applications : Text Retrieval, Extraction and Categorization, John Benjamins Publishing Co.

11.

B. Liu, Building text classifiers using positive and unlabeled examples, Proceedings of the Third IEEE International Conference on Data Mining(ICDM-03)

12.

김판준 ; 이재윤, (2007) 문헌간 유사도를 이용한 자동분류에서 미분류 문헌의 활용에 관한 연구, 정보관리학회지

13.

서정연 ; 고영중, (2002) 문서관리를 위한 자동문서범주화에 대한 이론 및 기법, 정보관리연구

14.

국민상, (2000) 자질 선정에 따른 Naive Bayesian 분류기의 성능비교, 한국정보관리학회 학술대회논문집

15.

Susan. Dumais, (2008) op. cit., pp.148-155.(online). <http://research.microsoft.com/~sdumais/cikm98.doc> [cited 2008. 10. 29],

16.

고영중, (2002) 전게논문, pp.19-32.(online). <http://nlp.sogang.ac.kr/pub/domestic/d02-jb002.pdf> [cited 2008. 10. 29],

17.

Y. Yang, Expert Network : Effective and Efficient Learning from Human Decisions in Text Categorization and Retrieval,

18.

이영숙, (2000) KNN 분류기의 범주할당 방법 비교 실험, 한국정보관리학회 학술대회논문집

19.

Gerald Salton, (1975) Dynamic Information and Library Processing, Prentice-Hall

20.

이재윤, (2005) 문헌간 유사도를 이용한 SVM 분류기의 문헌분류성능 향상에 관한 연구, 정보관리학회지

21.

한승희 ; 정영미, (2004) 클러스터링 기법을 이용한 개별문서의 지식구조 자동 생성에 관한 연구, 정보관리학회지

22.

T. Yu Clement, (1974) A Clustering Algorith Based on User Queries, JASIS

23.

Gerald Salton, (1975) Dynamic Information and Library Processing, Prentice-Hall

24.

Van Rijisbergen, C. J., (2008) The Hyper-Textbook of the C. J. Van Rijsgergen's textbook on Information Retrieval. 1998. <http://www.dei.unipd.it/~melo/bible/> [cited 2008. 11. 10],

25.

Helen J. Peat, (1991) The Limitations of Term Co-Occurrence Data for Query Expansion in Document Retrieval Systems, JASIS

26.

노정순, (1999) 탐색결과에 근거한 자연어질의 자동확장 및 응용에 관한 연구 고찰, 정보관리학회지

27.

남영신, (1992) 우리말 분류사전(3) : 꾸밈씨 기타, 한강문화사

28.

김성희, (2000) WWW상의 지능형 정보검색을 위한 기계학습 알고리즘 구현에 관한 연구, 정보관리학회지

한국도서관·정보학회지