본 연구에서 제안하는 기법은 최대 개념강도 인지기법(Maximal Concept-Strength Recognition Method: MCR)이다. 신규 데이터베이스가 입수되어 자동분류가 필요한 경우에, 기 구축된 여러 데이터베이스 중에서 최적의 데이터베이스가 어떤 것인지 알 수 없는 상태에서 MCR 기법은 가장 유사한 데이터베이스를 선택할 수 있는 방법을 제공한다. 실험을 위해 서로 다른 4개의 학술 데이터베이스 환경을 구성하고 MCR 기법을 이용하여 최고의 성능값을 측정하였다. 실험 결과, MCR을 이용하여 최적의 데이터베이스를 정확히 선택할 수 있었으며 MCR을 이용한 자동분류 정확률도 최고치에 근접하는 결과를 보여주었다.
The proposed method in this study is the Maximal Concept-Strength Recognition Method(MCR). In case that we don't know which database is the most suitable for automatic-classification when new database is imported, MCR method can support to select the most similar database among many databases in the legacy system. For experiments, we constructed four heterogeneous scholarly databases and measured the best performance with MCR method. In result, we retrieved the exact database expected and the precision value of MCR based automatic-classification was close to the best performance.
국가과학기술표준분류체계. http://www.kistep.re.kr/major/duty/plan_02_05.jsp.
이재윤. (2005). 문서측 자질선정을 이용한 고속 문서분류기의 성능향상에 관한 연구. 정보관리연구, 36(4), 51-69.
정영미. (2005). 정보검색연구:구미무역출판부.
Deng, Z. H.. (2002). Two odds-radio-based text classification algorithms (223-231). Proceedings of the Third International Conference on Web Information Systems Engineering (Workshops).
Ko, Y.. (2004). Using the feature projection technique based on a normalized voting method for text classification. Information Processing and Management, 40(2), 191-208.
Nuray, R.. (2005). Automatic ranking of information retrieval systems using data fusion. Information Processing and Management, 42(3), 595-614.
Salton, G.. (1988). Weighting approaches in automatic text retrieval. Information Processing and Management, 24(5), 513-523.
Voorhees, E. M.. (1995). Learning collection fusion strategies (172-179). Proceedings of the 18th Annual International ACM SIGIR Conference on Research and Development in Information Retrieval.
Witten, I. H.. (2005). Data Mining: Practical Machine Learning Tools and Techniques. 2nd ed:Morgan Kaufmann.