김정현(전남대학교) ; 배주연(전남대학교) 2005, Vol.22, No.4, pp.5-22 https://doi.org/10.3743/KOSIM.2005.22.4.005

광고산업과 미디어의 발전에 따라 광고물의 증가뿐만 아니라 광고와 관련한 많은 연구가 이루어지고 있으며, 그 결과 광고 관련 자료가 꾸준히 증가하고 있는 추세이다. 그런데 KDC 광고분야의 분류체계를 살펴보면 광고관련 분류항목이 너무나 미비하며, 더욱이 주류 배치에 있어 관련 학문과의 연관성을 고려하지 않아 사서나 이용자 모두에게 혼란을 초래하고 있다. 이러한 점을 감안하여 본 연구에서는 광고의 유형 및 학문적 특성에 대해 고찰하고, KDC를 비롯한 NDC, DDC, LCC와 같은 문헌분류법 및 광고 전문도서관, 그리고 인터넷 포털사이트와 인터넷서점 등의 분류체계를 분석함으로써 KDC 광고분야의 분류체계에 대한 문제점을 알아보고 이에 대한 개선방안을 제시하였다.


As the development of advertising industry and media the research about an advertisement get accomplished. As the result information resources called on the advertising materials are on an increasing trend. However, it looks into the classification system in advertising field of KDC, the problems are as the follows: ① the classification items are too incomplete, ② the main class is badly arranged. The reason have no regard for the correlation with a science. So, it gives rise to confusion to the librarian and user. The purpose of the study is to present the improvement plan on the classification system in advertising field of KDC. In order to build the improvement plan, the four steps are utilized. The first step is to investigate the characteristic of sciences on advertising and a type. The second one is to survey the current status of the library classification as KDC, NDC, DDC, and LCC. The third one is to analyse the classification system of library and web site on the advertising. The forth one is to grasp the problems on the classification system in advertising field of KDC.


본 연구의 목적은 국내 학술논문 데이터베이스에서 검색한 언어 네트워크 분석 관련 53편의 국내 학술논문들을 대상으로 하는 내용분석을 통해, 언어 네트워크 분석 방법의 기초적인 체계를 파악하기 위한 것이다. 내용분석의 범주는 분석대상의 언어 텍스트 유형, 키워드 선정 방법, 동시출현관계의 파악 방법, 네트워크의 구성 방법, 네트워크 분석도구와 분석지표의 유형이다. 분석결과로 나타난 주요 특성은 다음과 같다. 첫째, 학술논문과 인터뷰 자료를 분석대상의 언어 텍스트로 많이 사용하고 있다. 둘째, 키워드는 주로 텍스트의 본문에서 추출한 단어의 출현빈도를 사용하여 선정하고 있다. 셋째, 키워드 간 관계의 파악은 거의 동시출현빈도를 사용하고 있다. 넷째, 언어 네트워크는 단수의 네트워크보다 복수의 네트워크를 구성하고 있다. 다섯째, 네트워크 분석을 위해 NetMiner, UCINET/NetDraw, NodeXL, Pajek 등을 사용하고 있다. 여섯째, 밀도, 중심성, 하위 네트워크 등 다양한 분석지표들을 사용하고 있다. 이러한 특성들은 언어 네트워크 분석 방법의 기초적인 체계를 구성하는 데 활용할 수 있을 것이다.


The purpose of this study is to perform content analysis of research articles using the language network analysis method in Korea and catch the basic point of the language network analysis method. Six analytical categories are used for content analysis: types of language text, methods of keyword selection, methods of forming co-occurrence relation, methods of constructing network, network analytic tools and indexes. From the results of content analysis, this study found out various features as follows. The major types of language text are research articles and interview texts. The keywords were selected from words which are extracted from text content. To form co-occurrence relation between keywords, there use the co-occurrence count. The constructed networks are multiple-type networks rather than single-type ones. The network analytic tools such as NetMiner, UCINET/NetDraw, NodeXL, Pajek are used. The major analytic indexes are including density, centralities, sub-networks, etc. These features can be used to form the basis of the language network analysis method.


스피치 요약을 생성하는데 있어서 두 가지 중요한 측면은 스피치에서 핵심 내용을 추출하는 것과 추출한 내용을 효과적으로 표현하는 것이다. 본 연구는 강의 자료의 스피치 요약의 자동 생성을 위해서 스피치 자막이 없는 경우에도 적용할 수 있는 스피치의 음향학적 자질 즉, 스피치의 속도, 피치(소리의 높낮이) 및 강도(소리의 세기)의 세 가지 요인을 이용하여 스피치 요약을 생성할 수 있는지 분석하고, 이 중 가장 효율적으로 이용할 수 있는 요인이 무엇인지 조사하였다. 조사 결과, 강도(최대값 dB과 최소값 dB간의 차이)가 가장 효율적인 요인으로 확인되었다. 이러한 강도를 이용한 방식의 효율성과 특성을 조사하기 위해서 이 방식과 본문 키워드 방식간의 차이를 요약문의 품질 측면에서 분석하고, 이 두 방식에 의해서 각 세그먼트(문장)에 할당된 가중치간의 관계를 분석해 보았다. 그런 다음 추출된 스피치의 핵심 세그먼트를 오디오 또는 텍스트 형태로 표현했을 때 어떤 특성이 있는지 이용자 관점에서 분석해 봄으로써 음향학적 특성을 이용한 스피치 요약을 효율적으로 추출하여 표현하는 방안을 제안하였다.


Two fundamental aspects of speech summary generation are the extraction of key speech content and the style of presentation of the extracted speech synopses. We first investigated whether acoustic features (speaking rate, pitch pattern, and intensity) are equally important and, if not, which one can be effectively modeled to compute the significance of segments for lecture summarization. As a result, we found that the intensity (that is, difference between max DB and min DB) is the most efficient factor for speech summarization. We evaluated the intensity-based method of using the difference between max-DB and min-DB by comparing it to the keyword-based method in terms of which method produces better speech summaries and of how similar weight values assigned to segments by two methods are. Then, we investigated the way to present speech summaries to the viewers. As such, for speech summarization, we suggested how to extract key segments from a speech video efficiently using acoustic features and then present the extracted segments to the viewers.

김인후(중앙대학교 문헌정보학과 대학원) ; 김성희(중앙대학교 문헌정보학과) 2022, Vol.39, No.3, pp.293-310 https://doi.org/10.3743/KOSIM.2022.39.3.293

본 연구에서는 한국어 데이터로 학습된 BERT 모델을 기반으로 문헌정보학 분야의 문서를 자동으로 분류하여 성능을 분석하였다. 이를 위해 문헌정보학 분야의 7개 학술지의 5,357개 논문의 초록 데이터를 학습된 데이터의 크기에 따라서 자동분류의 성능에 어떠한 차이가 있는지를 분석, 평가하였다. 성능 평가척도는 정확률(Precision), 재현율(Recall), F 척도를 사용하였다. 평가결과 데이터의 양이 많고 품질이 높은 주제 분야들은 F 척도가 90% 이상으로 높은 수준의 성능을 보였다. 반면에 데이터 품질이 낮고 내용적으로 다른 주제 분야들과 유사도가 높고 주제적으로 확실히 구별되는 자질이 적을 경우 유의미한 높은 수준의 성능 평가가 도출되지 못하였다. 이러한 연구는 미래 학술 문헌에서 지속적으로 활용할 수 있는 사전학습모델의 활용 가능성을 제시하기 위한 기초자료로 활용될 수 있을 것으로 기대한다.


In this study, we analyzed the performance of the BERT-based document classification model by automatically classifying documents in the field of library and information science based on the KoBERT. For this purpose, abstract data of 5,357 papers in 7 journals in the field of library and information science were analyzed and evaluated for any difference in the performance of automatic classification according to the size of the learned data. As performance evaluation scales, precision, recall, and F scale were used. As a result of the evaluation, subject areas with large amounts of data and high quality showed a high level of performance with an F scale of 90% or more. On the other hand, if the data quality was low, the similarity with other subject areas was high, and there were few features that were clearly distinguished thematically, a meaningful high-level performance evaluation could not be derived. This study is expected to be used as basic data to suggest the possibility of using a pre-trained learning model to automatically classify the academic documents.

조윤희(중앙대학교) ; 황동열(중앙대학교) 2003, Vol.20, No.1, pp.301-320 https://doi.org/10.3743/KOSIM.2003.20.1.301

인터넷 이용의 폭발적인 증가와 통신망의 발달, 개인 홈페이지에서 전문 정보서비스에 이르는 디지털콘텐츠의 폭증, 새로운 파일교환 서비스의 등장과 해킹기술의 발달은 디지털콘텐츠의 복제와 배포를 더욱 확산시킴으로서 해당 저작물의 저작권자가 법적으로 보장받던 배타적 권리를 심각하게 위협하고 있다. 이에 디지털콘텐츠 권리의 원활한 거래와 확실한 요금부과, 보안대책, 부정이용 감시 등 저작권자와 이용자간의 가교역할을 할 수 있는 집중관리를 위한 디지털저작권관리시스템 구축이 절실히 요구되고 있다. 따라서 본 연구는 디지털콘텐츠의 원활한 유통을 지원할 수 있도록 집중관리제도의 도입을 위한 법적, 제도적 검토와 국내외 저작권집중관리제도의 현황을 파악하였다. 아울러 디지털콘텐츠 집중관리의 핵심이 되는 유일한 식별을 위한 식별체계와 데이터 요소의 표준화 및 디지털저작권관리(DRM) 검토를 통하여 디지털콘텐츠 저작권관리정보의 표준화에 기초자료를 제공하고자 하였다.


The rapidly increasing use of the Internet and advancement of the communication network, the explosive growth of digital contents from personal home pages to professional information service the emerging file exchange service and the development of hacking techniques . these are some of the trends contributing to the spread of illegal reproduction and distribution of digital contents, thus threatening the exclusive copyrights of the creative works that should be legally protected Accordingly, there is urgent need for a digital copyright management system designed to provide centralized management while playing the role of bridge between the copyright owners and users for smooth trading of the rights to digital contents, reliable billing, security measures, and monitoring of illegal use. Therefore, in this study, I examined the requirements of laws and systems for the introduction of the centralized management system to support smooth distribution of digital contents, and also researched on the current status of domestic and international centralized management system for copyrights. Furthermore, 1 tried to provide basic materials for the standardization of digital contents copyright management information through the examination of the essential elements of the centralized digital contents management such as the system for unique identification the standardization for data elements, and the digital rights management (DHM)


정보기술의 발전과 더불어 국가경쟁력 및 대국민 서비스 강화를 위한 공공정보시스템의 구축이 확산되고 있다. 또한 막대한 공공재원이 투자되는 공공정보시스템은 효율성에 대한 정기적인 평가를 통한 존재가치의 입증 및 문제점 진단을 통한 성능개선의 요구도 증대되고 있다. 따라서 본 연구는 국내의 대표적인 웹 기반 공공고용정보시스템 워크넷(Work-Net)의 데이터 및 서비스 품질을 102명의 이용자를 대상으로 평가하였다. 측정도구는 학계에서 많이 사용해온 정보내용, 정확성, 적시성, 출력형태, 사용의 용이성, 지원성으로 구성하였으며 t-test와 일원변량분석(one-way ANOVA)을 실시하여 이용자의 특성 및 검색정보에 따른 차이를 살펴보았다. 또한 최근 구직자들의 고용정보시스템에 대한 요구사항들을 분석하였다. 본 연구결과는 공공 및 민간운영 고용정보시스템 운영체제 효율화에 기여할 수 있는 유용한 기초자료를 제공할 것으로 본다.


A public information system is being expanded, along with the advance of information technology, to strengthen national competitiveness and provide people with better services. And there also is a growing need for the better performance of that system, as a tremendous amount of public finacial resources is invested in that. To address that need, it's required to make an evaluation of its efficiency on a regular basis to identify its problems and make it work better. The purpose of this study was, accordingly, to examine the quality of data and services provided by the Work-Net, a Web-based public employment information system. The subjects in this study were 102 users of it, and the system was evaluated in terms of content, accuracy, timelines, display format, ease of use and customer support. For data analysis, t-test and one-way ANOVA were implemented to find out the general characteristics of the users, and to see whether or not their view was different according to the type of information they searched for. The findings of this study are expected to lay some foundation for intensifying the efficiency of the public and private employment information systems.


본 연구는 AACR2와 이를 대체하는 새로운 목록규칙인 RDA의 규칙을 비교하여, RDA에 대한 이해를 높이고, 우리나라의 한국목록규칙에서 고려해야 할 사항을 파악하기 위한 것이다. RDA는 모든 유형의 자원을 서지제어할 수 있는 구조로 International Cataloging Principles(2009), FRBR, FRAD를 구현하기 위한 목록규칙이며, 국제적인 환경에 융통성 있게 적용가능하다. RDA는 웹환경에 맞는 시멘틱웹으로 구현이 가능하도록 집중기능과 다양한 관계에 기반을 두고 있어 미래의 목록에 큰 영향을 줄 것이기 때문에 국내에서도 이를 반영하는 연구가 필요하다. 비교는 JSC for Development of RDA의 2008년 RDA 초안을 기반으로 저작, 표현형, 구현형의 기술규칙을 대상으로 분석하였다. 구현형에서는 표제, 자료유형, 책임사항, 판사항, 발행사항, 형태사항, 총서사항의 기술영역별로, 저작과 표현형에서는 저작 유형에 따른 채택접근점을 중심으로 RDA와 AACR2 규칙 중에서 변경된 사항을 중심으로 살펴보았다. 본 연구는 RDA에서 제시한 목록규칙을 바탕으로 앞으로 목록의 발전 방향을 파악할 수 있으며, 국내의 목록규칙 개정 시에도 많은 도움이 될 것이다.


This study is to compare the descriptive cataloging rules between AACR2 and RDA, and then to find a direction of future cataloging and KCR 4. RDA is new cataloging rules that embody the International Cataloging Principles(2009), FRBR and FRAD. It is a structure of bibliographic control of all kinds of resources, and the rules can be flexibly applicable in the international cataloging community. It is critical to embody RDA in KCR 4 because RDA is likely to affect the future cataloging through its collocation function and relation function to construct semantic web of OPAC. This study analyzed the descriptive rules of work, expression, and manifestation based on RDA draft(2008) of JSC for Development of RDA. It analyzed the changes in the cataloging rules from AACR2 to RDA in such descriptive areas as title, type of resources, statement of responsibility, edition, publication, physical description and series in the manifestation level, and the preferred access points in both expression and work levels. The findings of this study will provide implications in revising KCR4.

정기태(Assistant Professor University of Oklahoma School of Library and Information Studies) ; 박일종(계명대학교) 2004, Vol.21, No.3, pp.1-14 https://doi.org/10.3743/KOSIM.2004.21.3.001

이용자들은 유사문서를 검색할 때, 각 가지 문서의 시각적표현을 통하여 도움을 얻게 되며, 모든 정보검색에 관한 연구는 이용자들의 다양한 요구를 충족시키기 위한 여러 가지의 해결책을 제시하고 있다. 제안되어진 해결책은 알파벳 순서로 만들어 진 파피루스 문서로부터 카드목록, 마이크로 필름을 이용한 저장, 컴퓨터 디스크를 이용한 파일 보관 등에 이르기까지 다양한 방법들을 들 수 있을 것이다. 또한 대부분의 정보검색 시스템들은 Document Surrogate(문헌을 대체할 수 있는 것들), 즉 요약문, 목차, 초록, 리뷰한 내용, 기계가독형목록(MARC) 기록물 등과 같은 서지자료들을 전체논문을 대체하여 이용하게 된다.본 논문에서는 또 다른 형태의 Document Surrogate로서 용어 리스트의 집단화 방법을 이용해서 찾아보았다. 이 Document Surrogate들은 Multidimensional Scaling (MDS)을 이용해서 2차원 그래프 위에 좌표로써 표현되어지고 있다. 사용된 2차원의그래프 위에서 좌표간의 거리는 문헌들의 유사성을 나타낸다고 해석할 수 있으며 거리가 가까우면 가까울수록 두 문서는 더욱 유사한내용을 포함하고 있다고 해석할 수 있는 것으로 밝혀졌다.


Visualization of documents will help users when they do search similar documents, and all research in information retrieval addresses itself to the problem of a user with an information need facing a data source containing an acceptable solution to that need. In various contexts, adequate solutions to this problem have included alphabetized cubbyholes housing papyrus rolls, microfilm registers, card catalogs and inverted files coded onto discs. Many information retrieval systems rely on the use of a document surrogate. Though they might be surprise to discover it, nearly every information seeker uses an array of document surrogates. Summaries, tables of contents, abstracts, reviews, and MARC recordsthese are all document surrogates. That is, they stand infor a document allowing a user to make some decision regarding it, whether to retrieve a book from the stacks, whether to read an entire article, etc.In this paper another type of document surrogate is investigated using a grouping method of term list. Using Multidimensional Scaling Method (MDS) those surrogates are visualized on two-dimensional graph. The distances between dots on the two-dimensional graph can be represented as the similarity of the documents. More close the distance, more similar the documents.

이상환(한국과학기술정보연구원) ; 신동구(한국과학기술정보연구원) ; 김재수(한국과학기술연구원) ; 정택영(한국과학기술정보연구원) ; 최진영(고려대학교) 2004, Vol.21, No.3, pp.15-29 https://doi.org/10.3743/KOSIM.2004.21.3.015

정보통신 및 인터넷의 급속한 발전으로 기존의 물리적인 저작물이 디지털 콘텐츠로 급속히 전환되면서 디지털 콘텐츠 자원에 대한 접근 및 서비스 방식과 기존의 식별기호로는 디지털 콘텐츠의 특성을 충족시키는 식별이 미흡하고 한계가 있다. 또한, URN명세를 만족하는 DOI 식별체계도 저널, 회의자료와 같은 학술잡지형태에만 활용되고 있어 다양한 형태의 비학술잡지에 적용할 식별체계가 필요하다. 따라서, 해외 주요 디지털 콘텐츠 서비스기관의 식별체계 활용사례와 KISTI에서 소장하고 있는 학술잡지 형태 2종, 비학술잡지 형태 3종 등 5종을 분석하여 학술잡지뿐만 아니라 비학술잡지에도 적용할 수 있는 고유 식별기호를 개발하고, 고유 식별기호 기반의 전자원문 연계시스템을 설계 및 구현하고자 한다.


With the rapid growth of information technology and the internet, the physical contents are transformed into digital contents at a fast rate. With the change, accessing the digital contents, the service methods and the identifier used for the digital contents are not systematic and limited for use. The DOI identifier system used for the URN is also limited to academic journals or magazines and are not adequately applicable for non-academic journal or digital contents. Therefore, we have developed a unique identifier based on the analysis made on the system adopted by foreign digital contents service institutes, two types of academic journals 3 types of non-academic journals owned by KISTI that can be adopted by non-academic journals. The identifier is to be used to design and implement a digital contents service system.

박일종(계명대학교) ; 신상헌(계명대학교) 2006, Vol.23, No.1, pp.243-259 https://doi.org/10.3743/KOSIM.2006.23.1.243

본 연구에서는 대학 도서관들이 이용자들에게 제공하는 여러 가지 기능들을 조사하고 그 가치를 측정하였다. 이용자들의 판단을 중시하는 연구의 수행을 위해 구체적인 대학 도서관의 이용요인이나 기능이 될 수 있는 상황이나 조건들은 이용자들이 직접 설정하고 그 중요도 평가를 설문조사방법으로 수집하였다. 수집된 자료의 분석은 크게 세 단계로 나누어 시행하였다. 첫째, 측정변수들의 관련성 및 독특성, 그리고 통계적 중요도에 따른 요인을 영역별로 나누기 위해 요인분석을 실시하였다. 둘째, 연구모형을 도출하기 위해 이분 로지스틱 회귀분석(binary logistic regression)을 실시하여 판별력 향상을 검정하였다. 세 번째 분석에서는 연구모형의 독립변수들에 대해 집단간 평균차이 분석을 실시하여 집단별 변수값 등 부가적인 설명을 하였다. 분석결과, 이용자들이 대학 도서관을 활용하는 목적 뿐만 아니라 이용자들에게 끼치는 지식이나 정보 그리고 도서관 시설들을 설명하는 데에는 도서요인, 경쟁 및 효율요인, 그리고 지불(무료)요인 등이 있음이 밝혀졌다. 또한 본 연구에서는 전자도서관 기능과 지불요인과의 상관성도 통계적으로 유의하게 나타났다.


This paper examines the values of various library functions according to users' points of view. To execute this study, the several 'circumstance', related variables and 'condition' variables that lead to factors or functions of academic libraries were measured.Analysis was carried out in three stages. In the first, factor analysis was used on the three multi variable dimensions to ensure that the groups of variables loaded significantly and uniquely on the respective dimensions. The second phase of analysis involved the use of binary logistic regression analysis to complete research models. In the third phase, t-test was used to identify significant differences in the independent variables for additional explanation of the models. Books, competition & effectiveness and fee verses free (fee-free hereafter) are the three main factors that distinguish not only the purpose of using an academic library but also the degree of influence on knowledge, information and library facilities for the users. In addition, the fee-free factor related to digital library facilities was also uncovered.
