연관규칙을 이용한 문헌정보학 전문용어 클러스터링 기법에 관한 연구

승현우; 박미영

ACOMS+ 및 학술지 리포지터리 설명회

한국과학기술정보연구원(KISTI) 서울분원 대회의실(별관 3층)
2024년 07월 03일(수) 13:30

사전등록 바로가기

오늘 하루 그만보기

P-ISSN1225-598X
E-ISSN2982-6292

홈으로

논문 상세

이전 다음

논문 투고

Vol.37 No.2

Citation Share

연관규칙을 이용한 문헌정보학 전문용어 클러스터링 기법에 관한 연구

한국문헌정보학회지 / Journal of the Korean Society for Library and Information Science, (P)1225-598X; (E)2982-6292

2003, v.37 no.2, pp.89-105

승현우 (서울여자대학교)
박미영 (서울여자대학교)

승현우, & 박미영. (2003). 연관규칙을 이용한 문헌정보학 전문용어 클러스터링 기법에 관한 연구. 한국문헌정보학회지, 37(2), 89-105.

복사

초록

본 논문에서는 대량의 웹 문서로부터 연관된 지식정보를 검색하기 위한 전문 검색엔진을 개발하기 위하여 텍스트에서 추출된 전문 용어를 효율적으로 클러스터링하기 위한 방법을 제안하고자 한다. 즉, 일반적인 용어들간의 무의미한 연관 규칙이 양산되는 것을 방지하기 위하여 전문 용어로 구성된 지식베이스 테이블을 이용하여 의미 있는 용어들간의 연관 규칙을 생성한다. 연관 규칙은 하나의 논문에서 사용된 전문 용어들의 집합을 트랜잭션 단위로 구성하여 Apriori 알고리즘을 적용하여 생성된다. 하나의 용어로부터 생성된 연관 규칙 집합은 해당 전문 용어와 관련된 클러스터로 구성된다.

keywords: 데이터마이닝, 연관규칙, 클러스터링, TF?TIDF, Apriori 알고리즘Data Mining, Association Rules, Clustering, TF?TIDF, Apriori Algorithm, 데이터마이닝, 연관규칙, 클러스터링, TF?TIDF, Apriori 알고리즘Data Mining, Association Rules, Clustering, TF?TIDF, Apriori Algorithm

Abstract

In this paper, an effective method for clustering terminologies extracted from text is proposed, in order to develope a search engine to extract relevant information from large web documents. To prevent frequency of the meaningless association rules among general terminologies, only useful association rules among terminologies are produced using database tables which consist of domain-specific terminologies. Such association rules are produced by applying the Apriori algorithm after forming transaction units from groups of association rules in a document. A group of association rules produced from a terminology forms in a cluster.

keywords: 데이터마이닝, 연관규칙, 클러스터링, TF?TIDF, Apriori 알고리즘Data Mining, Association Rules, Clustering, TF?TIDF, Apriori Algorithm, 데이터마이닝, 연관규칙, 클러스터링, TF?TIDF, Apriori 알고리즘Data Mining, Association Rules, Clustering, TF?TIDF, Apriori Algorithm

바로가기메뉴

논문 상세

Vol.37 No.2

연관규칙을 이용한 문헌정보학 전문용어 클러스터링 기법에 관한 연구

초록

Abstract

한국문헌정보학회지