바로가기메뉴

본문 바로가기 주메뉴 바로가기

logo

연관규칙을 이용한 문헌정보학 전문용어 클러스터링 기법에 관한 연구

한국문헌정보학회지 / 한국문헌정보학회지, (P)1225-598X; (E)2982-6292
2003, v.37 no.2, pp.89-105
승현우 (서울여자대학교)
박미영 (서울여자대학교)
  • 다운로드 수
  • 조회수

초록

본 논문에서는 대량의 웹 문서로부터 연관된 지식정보를 검색하기 위한 전문 검색엔진을 개발하기 위하여 텍스트에서 추출된 전문 용어를 효율적으로 클러스터링하기 위한 방법을 제안하고자 한다. 즉, 일반적인 용어들간의 무의미한 연관 규칙이 양산되는 것을 방지하기 위하여 전문 용어로 구성된 지식베이스 테이블을 이용하여 의미 있는 용어들간의 연관 규칙을 생성한다. 연관 규칙은 하나의 논문에서 사용된 전문 용어들의 집합을 트랜잭션 단위로 구성하여 Apriori 알고리즘을 적용하여 생성된다. 하나의 용어로부터 생성된 연관 규칙 집합은 해당 전문 용어와 관련된 클러스터로 구성된다.

keywords
데이터마이닝, 연관규칙, 클러스터링, TF?TIDF, Apriori 알고리즘Data Mining, Association Rules, Clustering, TF?TIDF, Apriori Algorithm, 데이터마이닝, 연관규칙, 클러스터링, TF?TIDF, Apriori 알고리즘Data Mining, Association Rules, Clustering, TF?TIDF, Apriori Algorithm

Abstract

In this paper, an effective method for clustering terminologies extracted from text is proposed, in order to develope a search engine to extract relevant information from large web documents. To prevent frequency of the meaningless association rules among general terminologies, only useful association rules among terminologies are produced using database tables which consist of domain-specific terminologies. Such association rules are produced by applying the Apriori algorithm after forming transaction units from groups of association rules in a document. A group of association rules produced from a terminology forms in a cluster.

keywords
데이터마이닝, 연관규칙, 클러스터링, TF?TIDF, Apriori 알고리즘Data Mining, Association Rules, Clustering, TF?TIDF, Apriori Algorithm, 데이터마이닝, 연관규칙, 클러스터링, TF?TIDF, Apriori 알고리즘Data Mining, Association Rules, Clustering, TF?TIDF, Apriori Algorithm

한국문헌정보학회지