송성전(연세대학교) ; 정영미(연세대학교) 2012, Vol.29, No.2, pp.205-224 https://doi.org/10.3743/KOSIM.2012.29.2.205

자동 분류에서 문헌을 표현하는 일반적인 방식인 BOW는 용어를 독립적으로 처리하기 때문에 주변 문맥을 반영하지 못한다는 한계가 있다. 이에 본 연구는 각 용어마다 주제범주별 문맥적 특징을 파악해 프로파일로 정의하고, 이 프로파일과 실제 문헌에서의 문맥을 비교하는 과정을 통해 동일한 형태의 용어라도 그 의미나 주제적 배경에 따라 구분하고자 하였다. 이를 통해 주제가 서로 다름에도 불구하고 특정 용어의 출현만으로 잘못된 분류 판정을 하는 문제를 극복하고자 하였다. 본 연구에서는 이러한 문맥적 요소를 용어 가중치, 분류기 결합, 자질선정의 3가지 항목에 적용해 보고 그 분류 성능을 측정했다. 그 결과, 세 경우 모두 베이스라인보다 분류 성능이 향상되었고 가장 큰 성능 향상을 보인 것은 분류기 결합이었다. 또한 제안한 방법은 학습문헌 수가 많고 적음에 따라 발생하는 성능의 편향을 완화하는데도 효과적인 것으로 나타났다.


One of the limitations of BOW method is that each term is recognized only by its form, failing to represent the term’s meaning or thematic background. To overcome the limitation, different profiles for each term were defined by thematic categories depending on contextual characteristics. In this study, a specific term was used as a classification feature based on its meaning or thematic background through the process of comparing the context in those profiles with the occurrences in an actual document. The experiment was conducted in three phases; term weighting, ensemble classifier implementation, and feature selection. The classification performance was enhanced in all the phases with the ensemble classifier showing the highest performance score. Also, the outcome showed that the proposed method was effective in reducing the performance bias caused by the total number of learning documents.

양동민(전북대학교 기록관리학과) ; 최광훈(알엠소프트) ; 김지혜(전북대학교 기록관리학과 박사과정) ; 유남희(전북대학교 기록관리학과) 2023, Vol.40, No.4, pp.167-200 https://doi.org/10.3743/KOSIM.2023.40.4.167

국내 행정정보 데이터세트 기록관리에서는 행정정보 데이터세트를 이관할 때 이관규격으로 SIARD를 활용할 것을 권고하고 있다. 그러나 행정정보 데이터세트의 기록관리 단위, SIARD를 지원하는 도구의 기술적 한계, 공공기관의 현실적인 상황 등으로 인해 SIARD 적용이 적합하지 않은 경우가 다수 발생하고 있다. 본 연구에서는 SIARD 이외에 행정정보 데이터세트의 이관규격을 다양화하는 방안을 제안하고자 한다. 행정정보 데이터세트의 기록관리에서는 데이터세트와 연계된 사용자 인터페이스의 재현에 대한 필요성에 대한 논의는 지속되고 있지만 구체적으로 제시되고 있지 않다. 본 연구에서는 필수보존속성(Significant Properties) 관점에서 사용자 인터페이스도 함께 보존되어야 할 속성임을 확인하고, 사용자 인터페이스를 효과적으로 재현하는 방안을 제시하고, 실제 검증한 사례를 제공하고자 한다.


For the record management of administrative information datasets in Korea, it is recommended to utilize SIARD as a transfer specification when transferring administrative information datasets. However, there are many cases where the application of SIARD is not suitable due to the record management unit of administrative information datasets, technical limitations of tools that support SIARD, and the realistic situation of public institutions. In this study, we propose a plan to diversify the transfer specifications of administrative information datasets other than SIARD. In the record management of administrative information datasets, the need to reproduce the user interface associated with the dataset has been discussed but not specifically presented. This study confirms that the user interface is a property to be preserved from the perspective of Significant Properties, proposes a method to effectively reproduce the user interface, and provides an example of actual verification.


의료기술과 생활환경의 발달로 인해 급속하게 노령화 사회가 진행되면서 노년의 삶에 대한 관심이 증가하고 있다. 본 연구는 32명의 노령이용자와의 심층면접을 통하여 정보요구와 이용행태를 파악하고 정보 접근 경로 및 온라인 커뮤니케이션 방식에 대하여 알아보고자 하였다. 면담내용 분석 결과 노령이용자들이 주로 정보를 찾고자 하는 주제들은 건강과 뉴스, 여가 및 취미 생활로 조사되었고, 주로 이용하는 매체는 TV, 라디오, 인터넷, 가족 및 친지, 그리고 신문 등이었으며, 온라인 커뮤니티, 블로그, 소셜 네트워크 사이트와 같은 소셜 컴퓨팅 서비스는 현재 노령이용자층의 이용률은 낮지만 가족 및 사회 구성원과의 접촉 및 커뮤니케이션 기회를 확대함으로써 삶에 대한 만족감과 정신적 행복감을 증가시킬 수 있는 효과가 있을 것으로 인지하고 있는 것으로 파악되었다.


The population aging occurs rapidly due to the advancement of the medical technology and living conditions and this led increased interests in how the elderly manages their lives. This study attempted to understand the information needs and behavior of the elderly users as well as to find about their information access and online communications. Based on the analysis of the interviews with thirty-two elderly users, they mainly looked for information on the topics such as health, news, leisure, and hobby. In addition, they primarily used television, radio, Internet, family members, relatives, and newspaper to obtain information. Their current use of social computing services including online communities, blogs, social network sites were low. However, the elderly users were aware of the social computing services’ effectiveness in increasing the satisfaction and happiness of their lives by expanding the opportunities for them to communicate with family members and other social members.

정힘찬(전북대학교) ; 김태영(전북대학교) ; 김용(전북대학교) ; 오효정(전북대학교) 2017, Vol.34, No.2, pp.137-158 https://doi.org/10.3743/KOSIM.2017.34.2.137

재난은 국민의 생명․신체․재산에 직접적인 영향을 미치는 사건으로, 재난 발생 시 신속하고 효과적인 대응을 위해서는 관련 정보들을 효율적으로 공유, 활용하는 협조 과정이 무엇보다도 중요하다. 현재 재난안전 유관기관별로 다양한 재난안전정보가 생산 및 관리되고 있지만, 각 기관별로 개별적인 용어와 의미를 정의하여 활용하고 있다. 이는 재난안전정보를 검색하고 접근하려는 실무자 입장에서 큰 걸림돌이며, 기관별 정보 활용도를 저해시키는 요인 중에 하나이다. 이러한 문제점을 해결하기 위해 재난안전정보의 통합적 관리를 위한 어휘자원의 표준화 작업의 선행 연구로, 본 연구에서는 재난안전 유관기관에서 관리하고 있는 어휘자원의 현황분석을 수행하였다. 또한 수집된 어휘자원을 대상으로 정보제공자 및 이용자 관점에서의 활용도 분석을 통해 어휘 그룹별 특성을 파악하고 이에 기반해 재난안전정보 관리를 위한 활용방안을 제안하였다.


Disaster has a direct influence on the lives of the people, the body, and the property. For effective and rapid disaster responses, coordination process based on sharing and utilizing disaster information is the essential requirement Disaster and safety control agencies produce and manage heterogeneous information. They also develop and use word dictionaries individually. This is a major obstacle to retrieve and access disaster and safety information in terms of practitioners. To solve this problem, standardization of lexical resources related disaster and safety is essentially required. In this paper, we conducted current status analysis about lexical resources in disaster and safety domain. Consequently, we identified the characteristics according to lexical groups. And then we proposed the utilization plan of lexical resources for disaster and safety information management.


조직 커뮤니케이션은 하나의 사회적 체제인 조직에서 구성원의 정보전달 행위를 통해 공동의 목표를 달성하는 과정이며 조직구조의 한 요소이다. 목표달성의 정도와 서비스의 질을 포함하는 효과성, 만족도 등은 조직성과로 표현될 수 있으며 도서관 조직성과로 간주될 수 있는 서비스 품질은 LibQUAL+™ 모형을 통해 측정될 수 있다. 본 연구에서는 조직 커뮤니케이션을 공공도서관 조직성과를 향상시키는 조직요소로 LibQUAL+™ 모형에 따른 서비스 품질을 조직성과로 설정하고 이들의 관계를 통해 커뮤니케이션의 특성이 차원별 서비스 품질에 어떠한 영향을 미치는지 알아보는 것을 그 목표로 한다. 이를 위해 수도권에 위치한 8개 공공도서관의 사서 및 이용자 대상 설문조사를 통한 통계적 분석을 시행한다. 연구결과 도서관의 상향, 수평, 하향 커뮤니케이션은 품질의 3개 차원(서비스의 감성적 차원, 정보통제 차원, 도서관 공간 차원)에 영향을 미치는 것으로 나타났다.


Organizational communication is an element of organizational structure formation; it is also a process of achieving organizational goals through the information sharing among the staff members in the organization as a social system. Organizational performance is a multidimensional concept composed of efficiency and effectiveness and satisfaction. Effectiveness implies service quality and the degree of goal achievement. Service quality by using the LibQUAL+™ model can be considered as an objective performance measure for libraries. This study aims to identify the effect of organizational communication in public libraries on service quality as a performance measure using the LibQUAL+™ model through statistical analyses of the results from questionnaire surveys of librarieans and users in 8 public libraries in Seoul metropolitan area. The result says the characteristics of organizational communication(upward, horizontal, downward communication) affects the three elements in the library service quality, such as affect of service, information control and library as place.


본 연구는 특정 영역 소규모 업무(Small Unit Operation) 수행을 지원하는 태스크 온톨로지 모형 개발에 관한 것이다. 기존 정보관리에서 효과적으로 진화된 지식시스템을 구축하기 위해서는 사전 작업인 온톨로지 개발이 필요하다. 대표적 SUO의 하나인 시민단체를 대상으로 선정하여 시민단체의 조직특성, 기대역할과 부진한 기능, 그리고 업무과정에서 발생되는 정보관리나 활용실태 등을 조사하였다. 그러나 온톨로지 구현의 기초 자료로 삼을 수 있는 시민운동이나 단체들에 대한 분류체계나 시소러스 등이 없는 상황에서 단체 특성 및 관련 업무 그리고 출판물 등의 생산정보나 사이트구성, 활동주제 및 내역 등의 기존 데이터만으로는 지식획득은 부족하다. 따라서 본 연구에서 채택된 모형 개발 방법론은 해당 분야 실무자 및 전문가와의 심도 높은 면담과 관찰이며 이를 통해 현장실무의 업무처리 과정에서 발생하는 지식을 추출하고 정보의 흐름 구조를 파악하여 그를 기반으로 시민단체의 역할 수행을 지원하는 태스크 온톨로지 모형을 구현하였다.


This paper presents a model of Task-Ontology for small unit operations(SUO) such as non-government organizations. Despite the rapid development and extension of NGOs in domestic area, most has insufficient structural domain resources in existence and underestimates the importance of information management. To improve the citizen's participation and to activate the conjoint actions among the NGOs, which are critical to its social role-playing in global society, the modeling Task-Ontology is ultimately intended to implement the knowledge management system of NGO. In the perspective of ontology competency, not only the analysis of resources in vary, but also in-depth interviews with the NGO's practicing personnels and subject experts, and also the intensive observations of task-processing are required for the knowledge acquisition.


본 연구의 목적은 확장된 계획행동이론을 적용하여 만화도서관을 방문하는 이용자들의 행동의도를 파악하는데 있다. 이를 위해 주관적 규범, 태도, 행동통제의 계획행동이론 기본변수에 만화에 대한 호감도, 서비스품질 등의 확장변수를 추가하여 변수의 영향을 증명하였다. 그 결과는 다음과 같다. 만화도서관을 재이용하고자 하는 이용자의 행동의도에 태도가 가장 큰 영향을 미치고 있으며, 나머지 요인들은 주관적 규범, 서비스품질, 지각된 행동통제의 순서대로 나타났다. 의외로 만화호감도의 경우 행동의도에 직접적 영향이 없었지만 태도, 주관적 규범, 지각된 행동통제를 매개하여 간접적으로 영향을 미치고 있었다. 또한 만화호감도와 서비스품질의 경우 기존변수인 태도, 주관적 규범, 지각된 행동통제에 대해 설명력을 보이고 있어 확장변수로써 행동의도에 대한 효과가 있음을 확인하였다.


The purpose of this study was to examine comics library user’s behavioral intention using the extended theory of planned behavior. In order to verify the effects of variables, such extended variables as comics likeability and service factor were added to such basic variables of the theory of planned behavior as subjective norm, attitude and behavioral control. Study findings are as follows: user’s attitude had the biggest effects on their behavioral intention of reuse of Comics Library, and it was followed by subjective norm, service quality and perceived behavioral control, in order. Comics likeability exceptionally had no direct effects on behavioral intention, but it had indirect effects via the mediation of attitude, subjective norm and perceived behavioral control. And second, comics likeability and service quality had power of explanation for such basic variables as attitude, subjective norm and perceived behavioral control, respectively, thus verifying their effects on behavioral intention as extended variables.


전자문서는 사람이 판독할 수 있는 문서 측면과 시스템이 이해하고 자동 처리할 수 있는 전자적 측면을 모두 갖추고 있어서 가용성이 뛰어나다. 전자문서를 이용하는 목적이 가용성이라면 이 특성이 잘 발휘되어 효과적이고 효율적인 전자문서유통이 되도록 강구하여야 할 것이다. 정부의 전자문서유통 상황은 종래의 종이문서 중심 사고방식과 각 부처별 업무중심 관점에서 아직 벗어나지 못하여 이러한 장점을 충분히 살리지 못하고 있다. 본 논문에서는 전자문서유통의 발전 방향을 제시하여 향후 방대하게 생산될 전자문서의 효용을 높이는 데에 도움을 주는 것을 목적으로 하였다. 우선 전자문서의 개념을 정의하고 XML을 이용하여 문서의 구조정보를 표현하는 이유와 한계, 정부 전자문서유통의 문제점을 설명하였다. 그리고 향후 정보 표현 방안, 문서 구성 방안과 표준 관리 방안을 제시하였다.


The electronic documents have the documental aspect that can legible by human and the electronic aspect that can be interpreted and processed automatically by machinery. This usability of electronic documents must be the reason that people use them in almost all the business areas rapidly in these days. That is because we have to utilize the characteristics to interchange electronic documents(EDI) effectively and efficiently. The electronic document interchange of Korean government cannot make the best of this benefit due to the traditional way of thinking based on paper document and the viewpoint of individual business, organization, and project. This paper proposed a direction of EDI for Korean government. At first, the concept of electronic docuemnts is defined. The reason and limitations of structuring the documents with XML and the hidden problems of present EDI in Korean public sector are also explained. And the way to preserve information, to design the structure of electronic document, and to maintain relevant standards is proposed.

강주연(전북대학교 기록관리학과) ; 김태영(전북대학교) ; 최정원(전북대학교) ; 오효정(전북대학교) 2016, Vol.33, No.3, pp.263-285 https://doi.org/10.3743/KOSIM.2016.33.3.263

요즘 커뮤니케이션 수단으로 가장 각광받고 있는 도구는 소셜네트워크서비스(Social Network Service, 이하 SNS)로, 이용자들의 접근성과 편의성을 증진시키는 가장 효과적인 서비스로 자리 잡았다. 본 연구에서는 가장 대표적인 SNS 서비스 중 자동수집이 가능한 서비스인 트위터(Twittter)를 선정, 국내외 국립기록관의 트위터 운용 현황을 비교 분석하고 그 특징을 파악함으로써 이용자들의 관심도를 향상시키기 위한 활성화 방안을 제언하고자 한다. 이를 위해 미국의 NARA를 비롯해 영국의 TNA, 호주의 NAA와 국내의 국가기록원의 트윗(tweet)을 수집하고 이에 대한 정보 유형 분석과 시계열 분석을 실시하였다. 정보 유형 분석은 국립기록관이 제공하는 정보가 이용자의 정보 요구에 부응하는가를 살펴보는데 목적이 있으며 시계열 분석은 시간의 추이에 따른 이용자의 반응 추이를 살펴보는데 그 목적이 있다. 각국의 국립기록관 트위터 운용의 비교분석을 통해 4가지의 특성을 도출하였으며 이를 바탕으로 우리나라 국가기록원의 트위터 활성화 방안을 제언하였다.


Nowadays, Social Network Service (SNS), which has been in the spotlight as a way of communication, has become a most effective tool to improve easy of information use and accessibility for users. In this paper, we chose Twitter as the most representative SNS services because of automatic crawling and investigated tweet data gathered from domestic and foreign National Archives - NARA of U.S.A., TNA of U.K.. NAA of Australia, and National Archives of Korea. We also conducted information genres analysis and trend analysis by timeline. Information genres analysis shows how archives satisfied users’ information needs as well as trends analysis of tweets helps to understand how users’ interestedness was changed. Based on comparison results, we distilled four characteristics of National Archives and suggested vitalization ways for National Archives of Korea.


문헌정보학 분야의 국내 학술지 논문으로 구성된 문헌집합을 대상으로 기계학습에 기초한 자동분류의 성능에 영향을 미치는 요소들을 검토하였다. 특히, 「정보관리학회지」에 수록된 논문에 주제 범주를 자동 할당하는 분류 성능 측면에서 용어 가중치부여 기법, 학습집합 크기, 분류 알고리즘, 범주 할당 방법 등 주요 요소들의 특성을 다각적인 실험을 통해 살펴보았다. 결과적으로 분류 환경 및 문헌집합의 특성에 따라 각 요소를 적절하게 적용하는 것이 효과적이며, 보다 단순한 모델의 사용으로 상당히 좋은 수준의 성능을 도출할 수 있었다. 또한, 국내 학술지 논문의 분류는 특정 논문에 하나 이상의 범주를 할당하는 복수-범주 분류(multi-label classification)가 실제 환경에 부합한다고 할 수 있다. 따라서 이러한 환경을 고려하여 단순하고 빠른 분류 알고리즘과 소규모의 학습집합을 사용하는 최적의 분류 모델을 제안하였다.


This study examined the factors affecting the performance of automatic classification based on machine learning for domestic journal articles in the field of LIS. In particular, In view of the classification performance that assigning automatically the class labels to the articles in 「Journal of the Korean Society for Information Management」, I investigated the characteristics of the key factors(weighting schemes, training set size, classification algorithms, label assigning methods) through the diversified experiments. Consequently, It is effective to apply each element appropriately according to the classification environment and the characteristics of the document set, and a fairly good performance can be obtained by using a simpler model. In addition, the classification of domestic journals can be considered as a multi-label classification that assigns more than one category to a specific article. Therefore, I proposed an optimal classification model using simple and fast classification algorithm and small learning set considering this environment.
