본 연구는 학교도서관에서 활용할 수 있는 도서추천시스템을 제안하는데 목적이 있다. 도서추천시스템은 DLS의 대출 데이터를 활용하여 연관규칙 기반의 알고리즘을 적용하였으며, 학교도서관 이용자들에게 개인화 도서추천 서비스 제공이 가능하도록 설계하였다. 이를 위해 Apriori 알고리즘 기반의 연관규칙과 매개 중심성 분석을 적용하고, 기술통계, 연관규칙 생성, 학생중심 추천, 도서 중심추천 등 세부 기능을 구현하였다. 이어서 사서교사를 대상으로 심층면담을 통해 도서추천시스템 사용에 대한 의견을 조사하였다. 조사 결과, 도서추천의 필요성 및 어려움, 학생의 반응, 기존 추천방식과의 차이점 및 활용방안, 개선 사항에 대한 의견을 확인할 수 있었으며, 이를 토대로 다음의 논의점을 제안하였다. 첫째, 개별학교의 특성을 파악하기 위해서 장기간의 대출 데이터의 제공이 필요하다. 둘째, 지역별 혹은 학교 특성별 데이터 통합 방안에 대한 논의가 필요하다. 셋째, 독서교육종합시스템에서 제공하는 도서추천시스템의 구축이 필요하다. 본 연구에서 제안된 내용을 토대로 향후 학교도서관 현장에서 활용할 수 있는 개인화 추천시스템 적용에 대한 다양한 논의가 이루어지길 기대한다.
The purpose of this study is to propose a book recommendation system that can be used in school libraries. The book recommendation system applies an algorithm based on association rules using DLS lending data and is designed to provide personalized book recommendation services to school library users. For this purpose, association rules based on the Apriori algorithm and betweenness centrality analysis were applied and detailed functions such as descriptive statistics, generation of association rules, student-centered recommendation, and book-centered recommendation were materialized. Subsequently, opinions on the use of the book recommendation system were investigated through in-depth interviews with teacher librarians. As a result of the investigation, opinions on the necessity and difficulty of book recommendation, student responses, differences from existing recommendation methods, utilization methods, and improvements were confirmed and based on this, the following discussions were proposed. First, it is necessary to provide long-term lending data to understand the characteristics of each school. Second, it is necessary to discuss the data integration plan by region or school characteristics. Third, It is necessary to establish a book recommendation system provided by the Comprehensive Support System for Reading Education. Based on the contents proposed in this study, it is expected that various discussions will be made on the application of a personalization recommendation system that can be used in the school library in the future.
본 연구는 도서관 상주작가 지원사업 문화프로그램 운영현황을 파악하고 프로그램에 대한 이용자의 인식과 선호, 사서의 인식을 조사하여 도서관 상주작가 문화프로그램의 운영개선 및 활성화 방안을 제시하는데 있다. 이를 위한 연구방법은 이론적 연구와 상주작가 문화프로그램 운영 현황조사, 도서관 이용자의 인식 및 선호에 대한 설문조사, 사서의 인식에 대한 인터뷰조사를 통한 실증적 연구를 병행하였다. 현황조사․설문조사․인터뷰조사는 2021년 5월부터 11월까지의 상주작가 지원사업 문화프로그램을 실시하고 있는 도서관을 대상으로 하였다. 문화프로그램의 어려움은 상주작가의 역량과 코로나로 인한 휴․재개관의 반복과 비대면 수업으로 나타났다. 프로그램 개선방안으로 상주작가와 다른 분야의 문인 초청과 문학프로그램 운영, 온라인 홍보에서 오프라인 홍보의 강화, 문화프로그램 운영의 사전교육, 사업 시작 시기 조정, 작가의 특성을 위한 교육, 이용자 연령을 고려한 진행방식, 이용자 선호 프로그램, 프로그램 운영시간, 정기문화프로그램 운영, 지역특성과 프로그램의 다양성 등을 고려해야 할 것이다.
This article aims to improve the cultural program for the resident writers in libraries by identifying the current status of the resident writer support project, examining users’ perceptions and preferences, and investigating librarians’ perceptions of the program. The research methods included an investigation (survey) of the program operation status, user perception and preference surveys, and interviews with librarians about their perceptions of the program. Data were collected from libraries with the cultural program for resident writers between May and November 2021. Findings showed there were challenges in operating the library cultural program due to the lack of resident writers’ quality, frequent changes in the program formats (online or offline), and library closures during the COVID-19 pandemic. For the program improvement, suggestions were made, including inviting good-quality resident writers and writers from other fields to the program, training resident writers, advertising the programs using online and offline media, training staff, and developing programs considering user ages and preferences and diversity in local communities.
본 연구는 국내에서 서비스되는 대체자료 장서 수준을 진단하고 향후 대체자료 장서개발의 방향성과 목표지향점을 제시하는 데 목적이 있다. 국가대체자료종합목록과 국내 인기도서 및 신간도서 목록을 장서기반 평가방법을 활용하여 비교․분석하였다. 연구결과 첫째, 10년간 인기도서 목록 기준 대체자료 장서 비율은 90.1%이다. ‘언어’, ‘예술’, ‘기술과학’ 주제의 대체자료 장서 비율이 낮은 편이며, 제작 매체별은 ‘텍스트 데이지자료’의 비율이 높았다. 둘째, 국가대체자료종합목록을 기준으로 주제별, 매체별, 제작기관별 공통장서 확보율과 장서고유성 지수를 분석한 결과 대체자료의 소장 장서량이 많은 도서관에서 공통장서와 고유장서의 편향성이 높게 나타났다. 공통장서 확보율이 높은 주제는 문학과 사회과학 순이며, 장서고유성 지수가 높은 주제는 종교, 예술, 언어 순으로 나타났다. 셋째, 최근 3년간 신간도서의 대체자료 장서 비율은 5.09%이며 같은 기간 동안 공공도서관의 평균 도서구입율은 8.83%이다. 신간도서 대비 대체자료 장서 비율의 적정 기준은 존재하지 않으며 시각장애인의 정보격차 해소를 위해 신간도서 대비 대체자료 장서 비율을 공공도서관 도서구입율 수준으로 높일 것을 제언하고자 한다.
The purpose of this study is to diagnose the current status of alternative materials in Korea and to suggest directions and goals for the development of alternative materials. The comprehensive list of national alternative materials and the list of popular and new books were analyzed using the collection evaluation method. Results first the percentage of alternative material collections based on the popular book list for 10 years is 90.1%. The production rate of alternative materials is low in the subjects of ‘Language’, ‘Art’ and ‘Technology and Science’. Most of the service formats were ‘text only daisy’. Second, the CCHR(Common Collection Holding Ratio) and CUI(Collection Uniqueness index) of alternative materials were analyzed using the union catalog. Libraries with a large volume of books have a high proportion of CCHR and CUI. Topics with the highest CCHR are ‘Literature’ and ‘Social Science’. The subjects with the highest collection uniqueness index are ‘religion’, ‘art’, and ‘language’. Third, the replacement ratio of new books for 3 years is 5.09%. During the same period, the average book purchase rate of public libraries was 8.83%. The average book purchase rate in public libraries is 8.83%, and it is necessary to increase the collection rate of alternative materials based on this ratio.
자녀에게 부모의 관심과 돌봄은 성장하는 과정에서 매우 중요한 요건이지만 부모도 양육이 매우 생소하고 어려운 일이다. 양육과정에서 부모는 양육과 관련된 끊임없는 정보요구가 발생하며 이를 해결하기 위하여 개인 수준에서 학부모 간 모임이나 관계를 통해 정보를 획득하고자 노력하는데 이 과정에서 갈등 및 스트레스를 받는 경우가 종종 발생한다. 이에 본 연구는 학부모 간 소셜네트워크의 특성을 탐색하고 이러한 소셜네트워크 특성이 정보공유의도 및 정보공유만족도에 미치는 영향을 파악하는 것을 목적으로 한다. 이를 위해 선행 연구를 조사하여 설문지를 개발하였으며 어린이집 한 곳을 선정하여 학부모를 대상으로 설문조사를 실시하였고 수집된 설문데이터는 소셜네트워크분석(SNA: social network analysis) 방법을 활용하여 분석하였다. 분석 결과, 소셜네트워크 특성과 정보공유의도, 정보공유만족도간 관계는 상관관계를 가지지만 학부모 소셜네트워크의 특성과 정보공유의도, 정보공유만족도의 영향관계는 성립되지 않았으며, 도움을 주고자 하는 것보다 받고자 하는 의도가 높은 것으로 나타났다. 이에 학부모들의 정보요구 충족을 위한 정책 지원 방안과 지역 공공도서관의 역할 재고의 필요성을 제시하였다.
Parents’ interest and care are very important for their children in the process of growing up, but parenting is also very unfamiliar and difficult for themselves. Parents constantly need information related to parenting, and in order to solve this problem, they try to obtain information through informal meetings or social relationships among parents at an individual level, which often brings up conflicts and stresses. Accordingly, the purpose of this study is to explore the characteristics of social networks among parents and to understand the influence of the network characteristics on information-sharing intention and information-sharing satisfaction. To this end, a survey questionnaire was developed based on previous studies and was administered among parents whose children are in a daycare center. Then, the data was analyzed using social network analysis (SNA) method. Findings indicate that the correlation among the social networks, the information -sharing intention, and the information-sharing satisfaction was significant, but the influence of the social networks on the information-sharing intention, and the information-sharing satisfaction was not established. It was also found that the intention to receive help was higher than the desire to help others. Policy suggestions to meet parents’ information needs and the need to reconsider the role of local public libraries were presented.
본 연구의 목적은 LDA 토픽모델링 결과와 BERTopic 토픽모델링 결과를 합성하는 방법론인 Augmented and Extended Topics(AET)를 제안하고, 이를 사용해 문헌정보학 분야의 연구주제를 분석하는 데 있다. AET의 실제 적용결과를 확인하기 위해 2001년 1월부터 2021년 10월까지의 Web of Science 내 문헌정보학 학술지 85종에 게재된 학술논문 서지 데이터 55,442건을 분석하였다. AET는 서로 다른 토픽모델링 결과의 관계를 WORD2VEC 기반 코사인 유사도 매트릭스로 구축하고, 매트릭스 내 의미적 관계가 유효한 범위 내에서 매트릭스 재정렬 및 분할 과정을 반복해 증강토픽(Augmented Topics, 이하 AT)을 추출한 뒤, 나머지 영역에서 코사인 유사도 평균값 순위와 BERTopic 토픽 규모 순위에 대한 조화평균을 통해 확장토픽(Extended Topics, 이하 ET)을 결정한다. 최적 표준으로 도출된 LDA 토픽모델링 결과와 AET 결과를 비교한 결과, AT는 LDA 토픽모델링 토픽을 한층 더 구체화하고 세분화하였으며 ET는 유효한 토픽을 발견하였다. AT(Augmented Topics)의 성능은 LDA 이상이었으며 ET(Extended Topics)는 일부 경우를 제외하고 대부분 LDA와 유사한 수준의 성능을 나타내었다.
The purpose of this study is to propose AET (Augmented and Extended Topics), a novel method of synthesizing both LDA and BERTopic results, and to analyze the recently published LIS articles as an experimental approach. To achieve the purpose of this study, 55,442 abstracts from 85 LIS journals within the WoS database, which spans from January 2001 to October 2021, were analyzed. AET first constructs a WORD2VEC-based cosine similarity matrix between LDA and BERTopic results, extracts AT (Augmented Topics) by repeating the matrix reordering and segmentation procedures as long as their semantic relations are still valid, and finally determines ET (Extended Topics) by removing any LDA related residual subtopics from the matrix and ordering the rest of them by (BERTopic topic size rank, Inverse cosine similarity rank). AET, by comparing with the baseline LDA result, shows that AT has effectively concretized the original LDA topic model and ET has discovered new meaningful topics that LDA didn’t. When it comes to the qualitative performance evaluation, AT performs better than LDA while ET shows similar performances except in a few cases.
본 연구는 중국 공공도서관의 위챗 공식계정을 이용한 마케팅이 도서관에 대한 인식 및 이용자 충성도에 미치는 영향을 파악하는 것을 목적으로 한다. 이를 위해 중국 공공도서관 위챗 공식계정을 구독한 이용자와 구독하지 않은 이용자의 심층 인터뷰를 통해 연구 가능성을 탐색하고 설문지를 개발하였다. 이를 기반으로 중국 6개 지역의 공공도서관 이용자를 대상으로 설문조사를 진행하였다. 그 결과 공식계정 운영특성은 중국 공공도서관에 대한 인식과 이용자 충성도에 긍정적인 영향을 미치고 있음을 확인하였다. 본 연구는 SNS를 활용한 중국 공공도서관 마케팅이 이용자의 도서관 이용목적, 공공도서관 인식 및 이용자 충성도에 어떠한 영향이 있는지 검증하였고 SNS 유형 중에 위챗 공식계정을 다루었다는 점에서 의의가 있다.
This study aims to analyze the effect of marketing using Chinese public library WeChat official accounts on the perception of the library and loyalty. For this purpose, research possibilities were explored, and a questionnaire was developed through in-depth interviews with users who subscribed to the Chinese public library WeChat official accounts and those who did not. A survey was conducted with the questionnaire for public library users in six regions of China. As a result, it was confirmed that the characteristics of the official account operation had a positive effect on the perception of the libraries and users’ loyalty. This study is meaningful in that it verified how Chinese public library marketing using SNS affected users’ purpose on the use of libraries, perception of libraries, and users’ loyalty, and suggested how to deal with WeChat official accounts among SNS types.
현대 업무환경 변화의 중심은 디지털 기술이라고 할 수 있다. 특히 업무관리시스템 및 문서생산시스템에서 생산한 기록으로 업무를 증명하는 일반적인 공공기관에서 기록관리체계는 업무환경 그 자체이기도 하다. 김포시는 제4차 산업혁명기술 시대에 선제적으로 대응하고 업무환경 혁신을 이루기 위해 한국지능정보사회진흥원(NIA)의 2021년 공공부문 클라우드 선도 프로젝트 사업에 지원하였고 선도 기관으로 확정되어 3억 3천의 지원을 받아 공공 클라우드 기반의 AI-OCR을 통한 기록물 검색 및 활용기능 강화 프로젝트를 진행하였다. 이를 통해 규격화된 색인 값에 의존한 검색과 이미지 열람에 그치던 비전자기록의 한계를 넘어 데이터화 하였고 AI-OCR이라는 신기술 적용으로 98%의 인식률을 구현하였다. 공공기관에 디지털 기술을 사용하여 업무 효율화, 생산성 향상, 개발비용 절감, 내․외부 이용자들의 기록관리 서비스 수준의 제고를 이루었기에 신기술과 기록물관리의 결합 사례연구를 통해 기록관리 분야 본연의 전문성을 높이는 방향과 업무환경 혁신 구현 사례를 공유하고자 한다.
It can be said that digital technology is at the center of the change in the modern work environment. In particular, in general public institutions that prove their work with records produced by business management systems and document production systems, the record management system is also the work environment itself. Gimpo City applied for the 2021 public cloud leading project of the National Information Society Agency (NIA) to proactively respond to the 4th industrial revolution technology era and implemented a public cloud-based AI-OCR technology enhancement project with 330 million won in support of 330 million won. Through this, it was converted into data beyond the limitations of non-electronic records limited to search and image viewing that depend on standardized index values. In addition, a 98% recognition rate was realized by applying a new technology called AI-OCR. Since digital technology has been used to improve work efficiency, productivity, development cost, and record management service levels of internal and external users, we would like to share the direction of enhancing expertise in the record management and implementation of work environment innovation.
본 연구는 대학도서관에서 제공하는 서비스 가치를 극대화하기 위하여 서비스디자인 방법론을 대학도서관에 적용하였다. 이를 위하여 서비스디자인 모형인 ‘더블다이아몬드모델’(Double Diamond Model)을 대학도서관에 적용, 서비스디자인 도구인 퍼소나(Persona), 고객여정지도(Customer Journey Map), 터치포인트(Touch Points)를 활용하였다. 서비스디자인을 대학도서관에 반영하기 위하여 주제와 관련된 문헌 및 선행연구를 고찰하였으며, 설문조사 및 이용자와 사서면담, 현장조사를 통해 상황별 이슈를 발견하고 퍼소나와 상황시나리오를 도출하였다. 나아가 설정된 퍼소나의 상황별 행동과 이용자의 감정변화에 대한 정보를 종합하여 이를 고객여정지도로 시각화하고 3개 분야 11개 항목의 서비스 개선안을 제안하였다. 본 연구는 특정 서비스를 개선하기보다 서비스 개선방안을 도출하기까지의 과정에 주안점을 두었다. 또한, 대학도서관 서비스개선 및 새로운 서비스 방안을 제시하는 것이 본 연구의 목적이었다. 이를 통해 실질적인 서비스 개선 방안을 대학도서관에 적용하였다는 것에 본 연구의 의의가 있다.
In this study, the author applied the service design methodology to the university library to maximize the service value provided by the university library. To this end, the ‘Double Diamond Model’, a service design model, was applied to the university library, and service design tools such as Persona, Customer Journey Map, and Touch Points were utilized. To reflect on the service design in the university library, the author first reviewed the literature related to the subject and researched the previous studies. Then, the issue was discovered by questionnaire surveys, interviews with users and librarians, and field investigations. Based on this, Persona and situation scenarios were derived. In addition, after synthesizing Persona’s situational behavior and user’s emotional change, the study visualized the Customer Journey Map and suggested service improvement plans for 11 items in 3 areas. This study is focused on the process of deriving service improvement plans rather than improving a specific service. The purpose of this study was to improve university library service and to suggest new service plans. The significance of this study is that the practical service improvement plans were applied to the university library.
코로나19로 인해 비대면 요소가 중요해지면서 메타버스가 사회적 주목을 받게 되었고, MZ세대는 공공도서관의 주 이용 세대가 되었다. 이러한 흐름에 비추어 볼 때, 공공도서관의 주 이용자인 MZ세대를 위한 서비스를 도입할 필요가 있으며, 사회적 발전에 맞춘 서비스를 제공할 필요가 있다. 따라서 본 연구는 MZ세대를 중심으로 설문조사와 반구조화 면담을 통해 메타버스에 대한 인식을 조사한 후, 공공도서관에서 이용자를 대상으로 한 메타버스 적용에 대한 방안을 제안하였다. 연구의 결과에 따라 본 연구에서 제언한 공공도서관의 메타버스 도입을 위한 방향은 첫째, 메타버스에 대한 기초적인 교육과 정보 제공 둘째, 소통을 바탕으로 한 커뮤니티를 장점으로 한 서비스의 제공. 셋째, 시공간의 제약을 받지 않는 프로그램의 제공 넷째, 메타버스에 대한 사서들의 전문성 향상을 통한 사서에 의한 서비스가 제공. 다섯째, MZ세대를 위한 서비스 제공이다.
As non-face-to-face elements became important due to COVID-19, the metaverse received social attention, and the MZ generation became the main users of public libraries. In light of this trend, it is necessary to introduce services for the MZ generation, the main users of public libraries, and to provide services tailored to social development. Therefore, this study investigated the perception of the metaverse through questionnaire surveys and semi-structured interviews, centered on the MZ generation, and then proposed a method for applying the metaverse to users in public libraries. According to the results of the study, the direction for the introduction of the metaverse in public libraries was suggested. First, it is necessary to provide basic education and information about the metaverse. Second, it is necessary to provide services that take advantage of the community based on communication. Third, a program that is not constrained by time and space should be provided. Fourth, services by librarians should be provided by enhancing the librarians’ expertise on the metaverse. Fifth, services for generation M must be provided.
본 연구는 Chatman(1996)의 정보빈곤이론(Theory of Information Poverty)을 바탕으로 정보 빈곤이 북한이탈주민의 한국사회적응에 미치는 영향을 알아보고자 하였다. 연구를 위해 정보빈곤이론을 기반으로 정보빈곤의 개념을 은폐(Secrecy), 기만(Deception), 위험감수(Risk-taking), 상황적 관련성(Situational relevance)에 따른 정보 수용이라는 네 가지 변인으로 구성하였고, 선행연구 분석 결과를 바탕으로 한국사회적응을 사회적 적응과 심리적 적응으로 구분하였다. 또한 생명윤리위원회(IRB)의 승인을 거쳐 2021년 8월 4일부터 8월 30일까지 북한이탈주민 지원 단체 <우리온>을 통해 국내 입국 후 최소 1년이 경과한 민법상 성년인 만 19세 이상의 북한이탈주민을 대상으로 설문조사를 실시하였다. 수집된 100개의 유효한 데이터를 빈도 분석, 신뢰도 분석, 상관관계 분석, 다중회귀분석을 통해 분석한 결과, 정보빈곤은 북한이탈주민의 사회적 적응과 심리적 적응에 유의한 영향을 미치는 것으로 나타났다. 특히, “기만” 변수는 북한이탈주민의 사회적 적응과 심리적 적응에 유의한 부(-)의 영향을 미치는 것으로 나타났다. 본 연구는 북한이탈주민을 정보빈곤층으로 정의하고, 그들의 한국사회적응을 Chatman의 정보빈곤이론을 기반으로 설명하였다는 점에서 학문적 의의가 있다. 무엇보다도, 질적 연구를 수행한 선행연구들과 달리 변수의 조작화를 통해 양적 연구를 시도하였다는 점에서 의미가 있다.
The present study aims to investigate the effects of information poverty on North Korean refugees’ social adaptation to South Korea based on Chatman’s Theory of Information Poverty (1996). Based on the Theory of Information Poverty, information poverty consists of four variables: Secrecy, Deception, Risk-taking, and information acceptance in response to situational relevance. And based on the previous studies, adaptation to South Korean life is divided into social adaptation and psychological adaptation. From August 4 to August 30, 2021, after approval by the IRB through the North Korean refugee support organization <Urion>, surveys were conducted with North Korean refugees who had lived in South Korea for at least one year and were aged 19 or older. The 100 collected valid data were analyzed using frequency analysis, reliability analysis, correlation analysis, and multiple linear regression analysis. Findings of the study indicated that information poverty had significant effects on North Korean refugees’ social and psychological adaptation. In particular, the “deception” variable had negative effects on social and psychological adaptation. The study has theoretical implications that it explains North Korean refugees’ adaptation to South Korea based on Theory of Information Poverty by defining them as information poor. Above all, it attempts a quantitative approach through operationalization of key concepts unlike previous studies that were conducted with qualitative approaches.
본 연구는 문헌정보학 현장인 도서관에서 제공되는 서비스인 이용자 교육의 관련 개념인 리터러시가 각종 문헌정보학 연구 분야에서 어떠한 연구 주제를 다루는지 확인하는 것을 목적으로 한다. 이를 위해 WoS와 KCI 데이터베이스에서 문헌정보학 분야 리터러시 관련 논문을 수집하여 키워드 분석 및 토픽 모델링 분석 기법을 상호보완적으로 사용해 분석하였다. 분석 결과, WoS와 KCI의 문헌정보학 분야 리티러시 관련 연구 동향은 저자 키워드, 주요 주제 등에서 차이가 있는 것으로 나타났으며, 토픽 모델링을 통해 KCI의 리터러시 관련 연구를 3개의 토픽으로 분류하였다. 또한, 연구에서 확인한 국내 문헌정보학 분야 리터러시 연구 동향은 전체 리터러시 관련 연구 동향과 연구량 급증 시기, 핵심 다빈출 키워드 차이가 있음을 분석하였다. 특히, 전체 분야 리터러시 연구는 ‘리터러시’, ‘교육’, ‘미디어’, ‘디지털’ 등의 단어가 다수 도출되었지만 문헌정보학 분야의 리터러시 연구는 ‘정보활용능력’, ‘학교도서관’ 등의 키워드가 다수 등장하였다. 이를 바탕으로 향후 국내에서도 정보가 급증하는 오늘날의 정보화 환경에 맞춰 정보에 대한 평가적인 안목을 기를 수 있는 능력에 관한 연구가 필요하다는 결론을 도출하였다.
The purpose of this study is to identify the topics of research related to the concepts of literacy in the field of Library and Information Science which is related to user education in libraries. Data were collected from the WoS and KCI databases, and complementary keyword analysis and topic modeling analysis techniques were used to identify topics of literature-related research articles in the field of Library and Information Science. Findings presented that there was a difference in keywords and topics between the two databases. Literacy-related topics identified from the KCI database were classified into three groups through topic modeling. Also, it was analyzed that there is a difference between the overall literacy-related research trend, the timing of the surge in research volume, and key frequent keywords in the Library and Information Science field confirmed in the study. In particular, in the study of literacy in all fields, a number of words such as ‘literacy’, ‘education’, ‘media’, and ‘digital’ were derived. However, in literature research in the field of Library and Information Science, keywords such as ‘information utilization ability’ and ‘school library’ appeared. Based on this, it was concluded that research on the ability to develop an evaluative eye for information is needed in line with today’s information environment, where information is rapidly increasing in Korea in the future.
본 연구에서는 한국어 데이터로 학습된 BERT 모델을 기반으로 문헌정보학 분야의 문서를 자동으로 분류하여 성능을 분석하였다. 이를 위해 문헌정보학 분야의 7개 학술지의 5,357개 논문의 초록 데이터를 학습된 데이터의 크기에 따라서 자동분류의 성능에 어떠한 차이가 있는지를 분석, 평가하였다. 성능 평가척도는 정확률(Precision), 재현율(Recall), F 척도를 사용하였다. 평가결과 데이터의 양이 많고 품질이 높은 주제 분야들은 F 척도가 90% 이상으로 높은 수준의 성능을 보였다. 반면에 데이터 품질이 낮고 내용적으로 다른 주제 분야들과 유사도가 높고 주제적으로 확실히 구별되는 자질이 적을 경우 유의미한 높은 수준의 성능 평가가 도출되지 못하였다. 이러한 연구는 미래 학술 문헌에서 지속적으로 활용할 수 있는 사전학습모델의 활용 가능성을 제시하기 위한 기초자료로 활용될 수 있을 것으로 기대한다.
In this study, we analyzed the performance of the BERT-based document classification model by automatically classifying documents in the field of library and information science based on the KoBERT. For this purpose, abstract data of 5,357 papers in 7 journals in the field of library and information science were analyzed and evaluated for any difference in the performance of automatic classification according to the size of the learned data. As performance evaluation scales, precision, recall, and F scale were used. As a result of the evaluation, subject areas with large amounts of data and high quality showed a high level of performance with an F scale of 90% or more. On the other hand, if the data quality was low, the similarity with other subject areas was high, and there were few features that were clearly distinguished thematically, a meaningful high-level performance evaluation could not be derived. This study is expected to be used as basic data to suggest the possibility of using a pre-trained learning model to automatically classify the academic documents.
본 연구는 도서관 정보서비스 환경에서 도서 이용자의 도서추천에 영향을 미치는 선호요인을 파악하기 위해 전 세계 도서 이용자의 참여로 이루어지는 사회적 목록 서비스인 Goodreads 리뷰 데이터를 대상으로 내용분석하였다. 이용자 선호의 내용을 보다 세부적인 관점에서 파악하기 위해 샘플 선정 과정에서 평점 그룹별, 도서별, 이용자별 하위 데이터 집합을 구성하였으며, 다양한 토픽을 고루 반영하기 위해 리뷰 텍스트의 토픽모델링 결과에 기반하여 층화 샘플링을 수행하였다. 그 결과, ‘내용’, ‘캐릭터’, ‘글쓰기’, ‘읽기’, ‘작가’, ‘스토리’, ‘형식’의 7개 범주에 속하는 총 90개 선호요인 관련 개념을 식별하는 한편, 평점에 따라 드러나는 일반적인 선호요인은 물론 호불호가 분명한 도서와 이용자에서 드러나는 선호요인의 양상을 파악하였다. 본 연구의 결과는 이용자 선호요인의 구체적 양상을 파악하여 향후 추천시스템 등에서 보다 정교한 추천에 기여할 수 있을 것으로 보인다.
This study analyzed the contents of Goodreads review data, which is a social cataloging service with the participation of book users around the world, to identify the preference factors that affect book users’ book recommendations in the library information service environment. To understand user preferences from a more detailed point of view, sub-datasets for each rating group, each book, and each user were constructed in the sample selection process. Stratified sampling was also performed based on the result of topic modeling of review text data to include various topics. As a result, a total of 90 preference factors belonging to 7 categories(‘Content’, ‘Character’, ‘Writing’, ‘Reading’, ‘Author’, ‘Story’, ‘Form’) were identified. Also, the general preference factors revealed according to the ratings, as well as the patterns of preference factors revealed in books and users with clear likes and dislikes were identified. The results of this study are expected to contribute to more sophisticated recommendations in future recommendation systems by identifying specific aspects of user preference factors.