바로가기메뉴

본문 바로가기 주메뉴 바로가기

ACOMS+ 및 학술지 리포지터리 설명회

  • 한국과학기술정보연구원(KISTI) 서울분원 대회의실(별관 3층)
  • 2024년 07월 03일(수) 13:30
 

logo

  • P-ISSN2466-2542
  • KCI

독후감 텍스트의 토픽모델링 적용에 관한 탐색적 연구

A Study on the Application of Topic Modeling for the Book Report Text

한국도서관·정보학회지 / Journal of Korean Library and Information Science Society, (P)2466-2542;
2016, v.47 no.4, pp.1-18
https://doi.org/10.16981/kliss.47.4.201612.1
이수상 (부산대학교)

초록

이 연구는 독후감 텍스트의 주제분석에 토픽모델링의 활용방안을 탐색하는 것을 목적으로 하고 있다. 텍스트의 주제분석 방안으로서 토픽모델링 분석방법을 이해하고, R에서 제공하는 “topicmodels” 패키지의 LDA 함수를 사용하여 23건의 사례 독후감 텍스트들을 대상으로 실제의 분석작업을 수행하였다. 토픽모델링 분석결과 16개의 토픽들을 추출하였고, 토픽과 구성 단어들의 관계에서 토픽 네트워크, 사례 독후감과 토픽들의 관계에서 독후감 네트워크를 구성하였다. 이후 토픽 네트워크와 독후감 네트워크를 대상으로 중심성 분석을 수행하였으며, 분석결과는 다음과 같다. 첫째, 16개의 토픽들이 1개의 컴포넌트를 가지는 네트워크로 나타났다. 이것은 16개 토픽들이 상호 연관되어 있다는 것을 의미한다. 둘째, 독후감 네트워크에서는 연결정도 중심성이 높은 독후감들과 낮은 독후감들로 구분이 되었다. 전자의 독후감들은 다른 독후감들과 주제적으로 유사성을 가지며, 후자의 독후감들은 다른 독후감들과 주제적으로 상이성을 가지는 것으로 해석하였다. 토픽모델링의 결과를 네트워크 분석과 결합함으로써 독후감의 주제파악에 유용한 결과들을 얻게 되었다.

keywords
독후감, 토픽모델링, 주제분석, 네트워크 분석, 중심성, Book report, Topic modeling, Topic analysis, Network analysis, Centrality

Abstract

The purpose of this study is to explore application of topic modeling for topic analysis of book report. Topic modeling can be understood as one method of topic analysis. This analysis was conducted with texts in 23 book reports using LDA function of the “topicmodels” package provided by R. According to the result of topic modeling, 16 topics were extracted. The topic network was constructed by the relation between the topics and keywords, and the book report network was constructed by the relation between book report cases and topics. Next, Centrality analysis was conducted targeting the topic network and book report network. The result of this study is following these. First, 16 topics are shown as network which has one component. In other words, 16 topics are interrelated. Second, book report was divided into 2 groups, book reports with high centrality and book reports with low centrality. The former group has similarities with others, the latter group has differences with others in aspect of the topics of book reports. The result of topic modeling is useful to identify book reports’ topics combining with network analysis.

keywords
독후감, 토픽모델링, 주제분석, 네트워크 분석, 중심성, Book report, Topic modeling, Topic analysis, Network analysis, Centrality

참고문헌

1.

Blei, D.M, Ng, A.Y, Jordan, M.I. 2003. “Latent Dirichlet Allocation.” Journal of Machine Learning Research, 3: 993-1022.

2.

Liu Lin, et al. 2016. “An overview of topic modeling and its current applications in bioinformatics.” SpringerPlus, 5(1). <DOI: 10.1186/s40064-016-3252-8>.

3.

Meza, David. 2015. “Topic Modeling in R.” <http://davidmeza1.github.io/2015/07/20/topic-modeling-in-R.html> (인용: 2016. 11.15).

4.

Ponweiser, Martin. 2012. Latent Dirichlet allocation in R. Diploma thesis, Institute for Statistics and Mathematics, WU (Wirtschaftsuniversitat Wien), Austria.

5.

Su Yeon Kim, Sung Jeon Song, Min Song. 2015. Investigation of topic trends in computer and information science by text mining techniques. 『정보관리학회지』, 32(1): 135-152.

6.

강범일, 송민, 조화순. 2013. 토픽 모델링을 이용한 신문 자료의 오피니언 마이닝에 대한 연구. 『한국문헌정보학회지』, 47(4): 315-334.

7.

김라연, 박은경. 2011. 독서 감상문의 구성 요소 분석 연구. 『교육과학연구』, 17: 17-30.

8.

남춘호. 2016. 일기자료 연구에서 토픽모델링 기법의 활용가능성 검토. 『비교문화연구』, 22(1):89-135.

9.

박동진. 2010. 독서 감상문 쓰기의 실태–구성 요소 분석을 중심으로. 『새국어교육』, 84:109-125.

10.

박자현, 송민. 2013. 토픽모델링을 활용한 국내 문헌정보학 연구동향 분석. 『정보관리학회지』, 30(1): 7-32.

11.

안주영, 안규빈, 송민. 2016. 텍스트 마이닝을 이용한 매체별 에볼라 주제 분석. 『한국문헌정보학회지』, 50(2): 289-307.

12.

유소영. 2015. 자아 중심 네트워크 분석과 동적 인용 네트워크를 활용한 토픽모델링 기반 연구동향분석에 관한 연구. 『정보관리학회지』, 32(1): 153-169.

13.

이기헌, 정효정, 송민. 2015. 문헌정보학 분야 핵심 학술지들의 가중 주제-방법 네트워크 분석. 『한국문헌정보학회지』, 49(3): 457-488.

14.

이원상, 손소영. 2015. 공간빅데이터 연구 동향 파악을 위한 토픽모형 분석. 『대한산업공학회지』, 41(1): 64-73.

15.

이수상. 2016. 독후감 텍스트의 언어 네트워크 분석에 관한 기초연구, 『한국도서관.정보학회지』, 47(3): 95-114.

16.

이재연. 2016. 키워드와 네트워크 : 토픽 모델링으로 본 『개벽』의 주제 지도 분석. 『상허학보』, 46:277-334.

17.

정한조. 2015. 온톨로지와 토픽모델링 기반 다차원 연계 지식맵 서비스 연구. 『지능정보연구』, 21(4): 79-92.

18.

진설아 등. 2013. 트위터 데이터를 이용한 네트워크 기반 토픽 변화 추적 연구. 『정보관리학회지』, 30(1): 285-302.

19.

협성문화재단 (2013). 책 읽는 당신이 아름답습니다: 제2회 협성독서왕 선발대회 독후감수상작품집. 해성.

한국도서관·정보학회지