
본문 바로가기 주메뉴 바로가기

ACOMS+ 및 학술지 리포지터리 설명회

  • 한국과학기술정보연구원(KISTI) 서울분원 대회의실(별관 3층)
  • 2024년 07월 03일(수) 13:30


검색어: design, 검색결과: 13
김양우(한성대학교) 2007, Vol.24, No.2, pp.45-69 https://doi.org/10.3743/KOSIM.2007.24.2.045

본 논문은 다음과 같은 두 부분으로 구성된다. 논문의 전반부는 네 개의 정보검색 모형을 다루고 있는데 이는 전통적 정보검색 모형과 보다 최근에 나온 세 연구자의 이용자 중심 인터액티브 모형을 포함한다. 인터액티브 정보검색 모형은 Belkin, Ingwersen, 그리고 Saracevic 에 의하여 제시된 것인데, 전통적 정보검색 모형을 포함한 각 모형의 장점과 한계점이 기술된다. 논문의 후반부에서 저자는 이상과 같은 모형들의 분석을 토대로 그 자신의 인터액티브 모형, 즉 빙산모형(Iceberg Model)을 제시하고 있다. 빙산모형의 타당성으로 다음과 같은 세 가지 사항을 강조하고 있는데, 즉, 보다 구체화된 시스템 특성의 포함, 보다 명확한 인터액티브 정보검색 요소간의 상호작용, 그리고 정보매개자의 증가된 역할 등이 그것이다. 요약하면, 빙산모형은 변화하는 정보추구환경에서 진화할 수 있는 틀을 제시하고 있다.


This paper is divided into two parts. The first part elaborates on four Information Retrieval (IR) models: a traditional IR model and three more recent, user-oriented models of IR interaction presented by Belkin, Ingwersen, and Saracevic. The strengths and limitations of each model are discussed. The second part, based on an analysis of the previous models, presents the author's interactive model, namely, the Iceberg Model. The rationales that are given to explain the design of this model are associated with the following: a greater specificity of system attributes; more concrete interplays among different components of IR interaction; and, the increased role of the Human Information Intermediary (HII). In sum, the new model presents a framework that can evolve in varying information-seeking contexts.


과학기술분야 전문학술지의 학술논문 투고와 심사처리 전과정에 대한 영문전용의 웹기반 시스템을 설계하기 위하여 국내외의 대표적인 사례로 Elsevier Editorial System과 KISTI-ACOMS를 조사하고 분석하였다. 이를 통하여 해양과학기술분야 전문학술지 Ocean Science Journal에 적용할 수 있는 웹기반 논문투고심사시스템이 구현되었다. 웹기반 시스템은 기존의 오프라인 논문심사과정에서 발생하는 원고관리, 심사기간의 지연과 원고분실 등의 문제점을 해결할 수 있을 뿐만 아니라 e-journal 전자출판의 기반이 자연스럽게 조성되어 효율적이고 신속한 학술정보 유통환경이 구축된다. 이러한 시스템의 개발과 활용은 과학기술분야 전문학술지의 수준제고 및 국제화 과정에 크게 기여할 것이다.


In order to design a web-based English Article Submission & Management System for science and technology research papers, Elsevier Editorial System and KISTI-ACOMS, international and domestic models--respectively--are studied and analysed. Through this analysis, a web-based paper submission and review system which can be applied to Ocean Science Journal, a research journal in the field of Oceanography, is developed. The web-based system is not only able to solve problems such as complex manuscript management, delays in the reviewing process, and loss of manuscripts that occur often in off-line paper review processes, but also is able to construct the basis for e-journal electronic publication. As a result, an effective and rapid scholarly communication environment can be made. The development and utilization of this system can improve the reputation and the globalization of science and technology research journals.


이 연구에서는 분포 유사도를 문헌 클러스터링에 적용하여 전통적인 코사인 유사도 공식을 대체할 수 있는 가능성을 모색해보았다. 대표적인 분포 유사도인 KL 다이버전스 공식을 변형한 Jansen-Shannon 다이버전스, 대칭적 스큐 다이버전스, 최소 스큐 다이버전스의 세 가지 공식을 문헌 벡터에 적용하는 방안을 고안하였다. 분포 유사도를 적용한 문헌 클러스터링 성능을 검증하기 위해서 세 실험 집단을 대상으로 두 가지 실험을 준비하여 실행하였다. 첫 번째 문헌 클러스터링 실험에서는 최소 스큐 다이버전스가 코사인 유사도 뿐만 아니라 다른 다이버전스 공식의 성능도 확연히 앞서는 뛰어난 성능을 보였다. 두 번째 실험에서는 피어슨 상관계수를 이용하여 1차 유사도 행렬로부터 2차 분포 유사도를 산출하여 문헌 클러스터링을 수행하였다. 실험 결과는 2차 분포 유사도가 전반적으로 더 좋은 문헌 클러스터링 성능을 보이는 것으로 나타났다. 문헌 클러스터링에서 처리 시간과 분류 성능을 함께 고려한다면 이 연구에서 제안한 최소 스큐 다이버전스 공식을 사용하고, 분류 성능만 고려할 경우에는 2차 분포 유사도 방식을 사용하는 것이 바람직하다고 판단된다.


In this study, measures of distributional similarity such as KL-divergence are applied to cluster documents instead of traditional cosine measure, which is the most prevalent vector similarity measure for document clustering. Three variations of KL-divergence are investigated; Jansen-Shannon divergence, symmetric skew divergence, and minimum skew divergence. In order to verify the contribution of distributional similarities to document clustering, two experiments are designed and carried out on three test collections. In the first experiment the clustering performances of the three divergence measures are compared to that of cosine measure. The result showed that minimum skew divergence outperformed the other divergence measures as well as cosine measure. In the second experiment second-order distributional similarities are calculated with Pearson correlation coefficient from the first-order similarity matrixes. From the result of the second experiment, second-order distributional similarities were found to improve the overall performance of document clustering. These results suggest that minimum skew divergence must be selected as document vector similarity measure when considering both time and accuracy, and second-order similarity is a good choice for considering clustering accuracy only.
