영어 사전 검색 서비스 이용자들은 원하는 영어 단어의 철자를 정확하게 기억하지 못하고, 발음만을 기억하는 경우가 있다. 이러한 이용자들에게 도움을 주기 위해 본 연구에서는 입말 표기, 즉 영어 단어 발음의 한글 표기를 이용하여 영어 단어를 효과적으로 검색할 수 있는 방법을 제안한다. 이를 위하여 코닉스(KONIX) 코드를 개발하며, 입말 표기와 영어 단어를 코닉스 코드들로 변환한다. 그리고 변환된 코닉스 코드들 사이의 음성적 유사도를 편집 거리 방법과 2-그램 방법을 이용하여 계산한다. 또한 제안한 방법이 입말 표기에 의한 영어 단어 검색에 매우 효과적임을 실험을 통하여 입증한다.
Users of searching Internet English dictionary sometimes do not know the correct spelling of the word in mind, but remember only its pronunciation. In order to help these users, we propose a method to retrieve English words effectively with a spoken word transliteration that is a Korean transliteration of English word pronunciation. We develop KONIX codes and transform a spoken word transliteration and English words into them. We then calculate the phonetic similarity between KONIX codes using edit distance and 2-gram methods. Experimental results show that the proposed method is very effective for retrieving English words with a spoken word transliteration.
최기선. 1990. 외국어 음차 표기의 음성적 유사도 비교 알고리즘. ,
F. 1964. ?A technique for com- puter detection and correction of spel- ling errors.? Communications of the ACM,
J. 1993. ?Combination of Multiple searches.? In Harman Washington. National Institute of Standards and Technology Special Publication,
T.. 1988. ??Fisching fore werds?. Pho- netic retrieval of written text in infor- mation retrieval systems.? Program,
(180-188.) J. 1995. ?Combining Multiple Evidence from Different Properties of Weighting Schemes ACM SIGIR Conference on Research and Development in Information Retrieval,
H. 1999. ?N-Gram- Based Indexing for Korean Text Retrieval,
(191-211.) E. 1992. ?Approximate string- matching with q-grams and maximal matches.? Theoretical Computer Sci- ence,
D. 2000. ?The TREC-8 Question Answering Track Evaluation.? In Text Retrieval Con- ference TREC-8.,
(1996.) Lessons from information retrieval.? In Proceedings of ACM SIGIR Conference on Information Retrieval,