상호정보량의 정규화에 대한 연구
한국문헌정보학회지 / Journal of the Korean Society for Library and Information Science, (P)1225-598X; (E)2982-6292
2003, v.37 no.4, pp.177-198
이재윤
(연세대학교)
이재윤.
(2003). 상호정보량의 정규화에 대한 연구. 한국문헌정보학회지, 37(4), 177-198.
초록
상호정보량은 용어간 유사도 산출을 비롯한 다양한 분야에서 연관성 척도로 사용되어왔다. 그러나 값의 범위가 일정하지 않으며 지나치게 저빈도인 경우를 선호하는 경향이 제한점으로 지적되고 있다. 이런 점을 보완하기 위해서 상호정보량을 정규화하는 상대적 상호정보량 계수를 제안하였다. 제안된 계수의 특성을 알아본 다음, 세 실험집단을 대상으로 전역적(global) 질의확장 검색을 수행한 결과 검색 성능을 향상시킬 수 있었다.
- keywords
-
상호정보량,
상대적 상호정보량 계수,
연관성척도,
정보검색,
질의확장Mutual Information,
Relative Mutual Information Coefficients,
Association Measures,
Information Retrieval,
Query Expansion,
상호정보량,
상대적 상호정보량 계수,
연관성척도,
정보검색,
질의확장Mutual Information,
Relative Mutual Information Coefficients,
Association Measures,
Information Retrieval,
Query Expansion
Abstract
Mutual information, as an association measure, has been used for various purposes as well as for calculating term similarity. There are, however, some limits in mutual information. It tends to emphasize low frequency terms extremely because the marginal value of mutual information changes inversely to frequency of terms. To compensate for this limit, this study suggests relative mutual information(RMI) coefficients which normalize mutual information, and examines their characteristics in some details. The RMI coefficients also improve effectiveness of global query expansion when they are adapted to three different collections.
- keywords
-
상호정보량,
상대적 상호정보량 계수,
연관성척도,
정보검색,
질의확장Mutual Information,
Relative Mutual Information Coefficients,
Association Measures,
Information Retrieval,
Query Expansion,
상호정보량,
상대적 상호정보량 계수,
연관성척도,
정보검색,
질의확장Mutual Information,
Relative Mutual Information Coefficients,
Association Measures,
Information Retrieval,
Query Expansion