본 연구에서는 국내 주요 웹 검색 포탈인 네이버, 야후 코리아, 엠파스가 제공하는 웹 디렉토리들의 커버리지 및 커버리지 중복성을 분석하였다. 이를 위하여 본 연구는 웹 디렉토리에 등록된 사이트들의 수집 방법을 개발하고, 대분류 매핑, 중복 분류 및 참조 링크 고려와 같은 커버리지 및 커버리지 중복성 분석에 필요한 방법론을 제시하였다. 조사 결과, 참조 링크의 허용 여부가 웹 디렉토리의 커버리지에 매우 큰 영향을 미치며, 국내 웹 디렉토리들 사이의 커버리지 중복성이 매우 낮은 것으로 나타났다. 본 연구는 국내 웹 디렉토리들에 대한 이해를 넓히고, 웹 디렉토리들의 커버리지 및 커버리지 중복성 분석에 필요한 방법론을 제시함으로써, 웹 디렉토리에 관한 연구에 기여할 것으로 기대된다.
This study examines coverage and coverage overlap of the three major Korean web directories, Naver, Yahoo Korea, and Empas. This study also suggests a methodology for collecting and processing web sites provided by these web directories. A method for mapping main categories was developed. Each directory provided registered web pages in a slightly different way. Reference links had a significant influence on the coverage of each web directory. The overlap of pages among three directories was quite low. It is expected that this study could contribute to the field of web research by providing insights to how directories provide web pages and suggesting a methodology for the analysis of directory coverage.
(2001). 인터넷 쇼핑몰의 상품 분류체계에 대한 연구. 18(4), 210-215.
(1997). 인터넷 탐색엔진의 분류체계에 관한 연구: 컴퓨터, 인터넷 분야를 중심으로. , -.
(1998). 웹 문서 분류체계의 분석 및 새로운 설계. 32(2), 207-230.
(2002). 한국십진분류체계와 웹문서의 통합분류체계 개발. 39(1), 25-43.
(2001). 인터넷 검색엔진의 디렉토리 구성에 관한 연구. 18(2), 143-163.
(2001). 군사학 분야 웹 문서 분류체계의 설계. 32(2), 323-347.
(2001). 여성학분야 인터넷 자원의 분류체계에 관한 연구. 2(2), 397-417.
(2001). 인터넷 서점의 주제별 분류체계 설계에 관한 연구. 35(3), 17-34.
(1998). 인터넷 학술정보자원의 디렉토리 서비스 설계에 있어서 DDC분류 체계의 활용에 관한 연구. 15(2), 47-67.
(1998). 인터넷 정보서비스의 분류체계에 대한 비교연구: 물리학을 중심으로. 15(3), 45-57.
(2001). 산업분야 인터넷 자원의 분류체계에 관한 연구. 18(3), 285-309.
(1997). Search engines on the world wide web and information retrieval from the internet: A review and evaluation. 21(2), 67-82.
(1999). Mercator: a scalable, extensible web crawler. 2(4), 219-229.
(1999). Accessibility of information on the web. 400, 107-109.
(1998). Searching the World Wide Web. 280, 98-100.
(2001). High-Performance Web Crawling. , -.