최근 들어 다양한 분야에서 딥러닝이 혁신적인 기계학습 기법으로 급속하게 확산되고 있다. 이 연구에서는 딥러닝 연구동향을 분석하기 위해서 자아 중심 주제 인용분석 기법을 변형하여 응용해보았다. 이를 위해 Web of Science에서 ‘deep learning’으로 탐색하여 검색된 문헌 중 소수의 씨앗 문헌으로부터 인용 관계를 통해 분석 대상 문헌을 확보하는 방법을 시도하였다. 씨앗 문헌을 인용하는 최근 논문들을 딥러닝 분야의 현행 연구를 반영하는 자아 문헌집합으로 설정하였다. 자아 문헌으로부터 빈번히 인용된 선행 연구들은 딥러닝 분야의 연구 주제를 나타내는 인용 정체성 문헌집합으로 설정하였다. 자아 문헌집합에 대해서는 공저 네트워크 분석을 비롯한 정량적 분석을 실시하여 주요 국가와 연구 기관을 파악하였다. 인용 정체성 문헌들에 대해서는 동시인용 분석을 실시하고, 도출된 문헌 군집을 인용하는 주요 키워드인 인용 이미지 키워드를 파악하여 주요 문헌과 주요 연구 주제를 밝혀내었다. 마지막으로 특정 주제에 대한 인용 영향력이 성장하는 추세를 반영하는 인용 성장지수 CGI를 제안하고 측정하여 딥러닝 분야의 선도 연구 주제가 변화하는 동향을 밝혔다.
Recently, deep learning has been rapidly spreading as an innovative machine learning technique in various domains. This study explored the research trends of deep learning via modified ego centered topic citation analysis. To do that, a few seed documents were selected from among the retrieved documents with the keyword ‘deep learning’ from Web of Science, and the related documents were obtained through citation relations. Those papers citing seed documents were set as ego documents reflecting current research in the field of deep learning. Preliminary studies cited frequently in the ego documents were set as the citation identity documents that represents the specific themes in the field of deep learning. For ego documents which are the result of current research activities, some quantitative analysis methods including co-authorship network analysis were performed to identify major countries and research institutes. For the citation identity documents, co-citation analysis was conducted, and key literatures and key research themes were identified by investigating the citation image keywords, which are major keywords those citing the citation identity document clusters. Finally, we proposed and measured the citation growth index which reflects the growth trend of the citation influence on a specific topic, and showed the changes in the leading research themes in the field of deep learning.
본 연구는 새로운 분석법으로 떠오르는 처방적 분석 기법을 소개하고, 이를 분류 기반의 시스템에 효율적으로 적용하는 방안을 제시하는 것을 목적으로 한다. 처방적 분석 기법은 분석의 결과를 제시함과 동시에 최적화된 결과가 나오기까지의 과정 및 다른 선택지까지 제공한다. 새로운 개념의 분석 기법을 도입함으로써 문헌 분류를 기반으로 하는 응용 시스템을 더욱 쉽게 최적화하고 효율적으로 운영하는 방안을 제시하였다. 최적화의 과정을 시뮬레이션하기 위해, 대용량의 학술문헌을 수집하고 기준 분류 체계에 따라 자동 분류를 실시하였다. 처방적 분석 개념을 적용하는 과정에서 대용량의 문헌 분류를 위한 동적 자동 분류 기법과 학문 분야의 지적 구조 분석 기법을 동시에 활용하였다. 실험의 결과로 효과적으로 서비스 분류 체계를 수정하고 재적용할 수 있는 몇 가지 최적화 시나리오를 효율적으로 도출할 수 있음을 보여 주었다.
This study aims to introduce an emerging prescriptive analytics method and suggest its efficient application to a category-based service system. Prescriptive analytics method provides the whole process of analysis and available alternatives as well as the results of analysis. To simulate the process of optimization, large scale journal articles have been collected and categorized by classification scheme. In the process of applying the concept of prescriptive analytics to a real system, we have fused a dynamic automatic-categorization method for large scale documents and intellectual structure analysis method for scholarly subject fields. The test result shows that some optimized scenarios can be generated efficiently and utilized effectively for reorganizing the classification-based service system.
본 연구는 Figshare를 통해 공유되고 있는 문헌정보학분야 연구데이터의 유형, 주제, 공개 수준 등을 분석하고 재사용성이 상대적으로 높은 데이터의 특성을 통계적으로 해석해 보았다. 분석 결과 데이터의 유형은 dataset과 paper 유형이, 주제 분야는 open access와 research data가 가장 많은 비중을 차지하였으며, 70%에 가까운 연구데이터가 pdf와 같이 편집과 재사용이 원활하지 않은 형태로 공개되어 있는 것으로 조사되었다. 또한 연구데이터의 특성과 활용 정도간의 관계 분석 결과, 주제에 있어서는 APC(Article Processing Charge)를 비롯한 open access 영역이 가장 많이 활용되고 있는 것으로 나타났으며, 데이터 유형에 있어서는 paper의 활용도가 가장 높은 것으로 나타났다.
This study analyzed the type, subject and open level of research data in the field of library and information science field shared by Figshare, and statistically analyzed the characteristics of data with relatively high recyclability. The results of the analysis showed that datasets and papers were most common data types, and open access and research data were the most common keywords of data, and that 70% of the data were published in a form that can not be processed mechanically such as pdf. As a result of analysis of the relationship between characteristics of research data and degree of sharing, open access areas such as APC (Article Processing Charge) were found to be most common in the subject. However in data type, gray literature such as paper found to be highly utilized rather than dataset.
기술문서는 지식정보사회에서 생성되는 중요 연구 성과물로, 이를 제대로 활용하기 위해서는 정보 요약 및 정보추출과 같은 개선된 정보 처리 방법을 토대로 기술문서 활용의 편의성을 높여줄 필요가 있다. 이에 본 연구는 기술문서의 핵심 정보를 추출하기 위한 방안으로, 기술문서의 구조와 정의문 패턴을 기반으로 전문용어 및 정의문을 자동 추출하고, 이를 기반으로 전문용어사전을 구축할 수 있는 시스템을 제안하였다. 나아가 전문용어사전을 지식메모리로서 보다 다양하게 활용할 수 있도록 전문용어사전에 기반한 개인화서비스 제공방안을 제안하였다. 이처럼 전문용어 및 정의문 자동추출을 기반으로 전문용어사전을 구축하게 되면 새롭게 등장하는 전문용어를 빠르게 수용할 수 있어 이용자들이 최신정보를 보다 손쉽게 찾을 수 있다. 더불어 개인화된 전문용어사전을 이용자에게 제공한다면 전문용어사전의 가치와 활용성, 검색의 효율성을 극대화할 수 있다.
Technical documents are important research outputs generated by knowledge and information society. In order to properly use the technical documents properly, it is necessary to utilize advanced information processing techniques, such as summarization and information extraction. In this paper, to extract core information, we automatically extracted the terminologies and their definition based on definitional sentences patterns and the structure of technical documents. Based on this, we proposed the system to build a specialized terminology dictionary. And further we suggested the personalized services so that users can utilize the terminology dictionary in various ways as an knowledge memory. The results of this study will allow users to find up-to-date information faster and easier. In addition, providing a personalized terminology dictionary to users can maximize the value, usability, and retrieval efficiency of the dictionary.
최근 문헌정보학의 관련 분야로 주목받고 있는 데이터과학은 오랫동안 문헌정보학에서 해오던 정보의 수집, 저장, 조직, 분석, 활용 등의 활동을 데이터에 적용하여 그 가치를 이해하려는 학문이며, 통계학과 컴퓨터공학 등 다른 학문분야와의 연계가 필요한 분야이다. 이러한 데이터과학 분야의 연구 영역을 파악하기 위하여 동시출현단어 분석을 사용하여 Web of Science 핵심컬렉션에 수록된 문헌들 중 데이터과학 관련 자료들을 수집하고, 그 주제범주를 활용하여 네트워크분석을 실시하였다. 총 667건의 자료에 대한 159개의 주제범주를 기술분석하여 데이터과학 관련 연구가 많이 이루어지고 있는 학문분야를 조사하였고, 네트워크분석을 통해 데이터과학 분야 연구영역의 지적구조를 시각적으로 파악하였다. 분석결과, 데이터과학 분야의 연구들은 2개 영역 9개 군집으로 구분되었으며, 주제범주의 용어들 중 중심성이 높은 용어들을 통해 각 군집의 대표적인 주제들을 선정하였다. 연구의 결과는 데이터과학 분야의 연구들에 대한 지적구조를 파악하는데 도움이 될 수 있고, 문헌정보학과의 연계융합전공으로서의 데이터과학 교과과정 개발에 방향성을 제시할 수도 있을 것이다.
Data Science is emerging as a closely related field of study to Library and Information Science (LIS), and as an interdisciplinary subject combining LIS, statistics and computer science in an attempt to understand the value of data by applying what LIS has been doing for collecting, storing, organizing, analyzing, and utilizing information. To investigate which subject fields other than LIS, statistics, and computer science are related to Data Science, this study retrieved 667 materials from Web of Science Core Collection, extracted terms representing Web of Science Categories, examined subject fields that are studying Data Science using descriptive analysis, analyzed the intellectual structure of the field by co-word analysis and network analysis, and visualized the results as a Pathfinder network with clustering created with the PNNC clustering algorithm. The result of this study might help to understand the intellectual structure of the Data Science field, and may be helpful to give an idea for developing relatively new curriculum.
다양한 분야에 걸쳐 생산성과 경쟁력 강화를 위한 IT활용 방안 중 하나인 RFID 기술은 바코드 시스템을 대체하고 시스템 이용에 보다 편리함을 가져올 기술로 주목받고 있다. RFID시스템은 이미 도서관을 비롯한 일부 기록관에도 적용되어 있으며, 한층 효과적인 기록관리 시스템 개발에 진보를 가져올 것으로 기대 받고 있다. 그러나 아직 시스템은 도입 초기단계에 놓여있고, 사소한 문제점과 불안전한 요소를 포함하고 있어 기록관 도입에 어려움을 겪고 있으며 시스템의 구체적인 문제를 파악한 연구는 이루어지지 않고 있다. 본 연구에선 이러한 점에 착안하여 RFID기반 기록관리체계를 운영하고 있는 기록관의 실무 담당자들을 대상으로 인터뷰 및 설문조사를 실시하였다. 이를 바탕으로 현재 기록관에서 운영 중인 RFID기반 기록관리체계의 운영 현황을 파악하고, RFID기반 기록관리체계의 문제점을 도출하여 이를 통해 효율적 운영방법에 있어 개선방안을 제시해보고자 한다.
RFID technology that is one of the ways to enhance productivity and competitiveness across diverse sectors of IT, is being hailed as a technology that replaces the bar code system and brings more convenience to the system. RFID system have been already applied to libraries, and archive, and is expected to bring advancements in the development of more effective records management systems. However, the system is still in the initial stage of the introduction, and it has been difficult to introduction because of trivial problems and unsafe elements, and studies have not been conducted to identify the detailed problems of the system. So, In this study, conducted interviews and surveys of executives of archive who operate the RFID based records management system. Based on this, we found the operational status of the RFID based records management system operating in the current archive, and the problems in the RFID based records management system. In conclusion, we suggest improvements in efficient operation methods.
여가를 위해 독서를 하는 독자는 특정 작가를 선호하는 경우가 많은데 독서분야를 확장할 때에도 자신이 선호하는 작가와 연관된 작가나 장르로 독서분야를 확장하는 성향이 있다. 이 연구에서는 중심작가로 에드거 앨런 포를 선정한 후 독자들이 에드거 앨런 포와 연관하여 다른 독자에게 추천하는 작가와 작품정보를 기반으로 작가 이미지를 분석하였다. 에드거 앨런 포와 동시출현한 작가와 작품의 빈도수를 분석하고 추천작가간, 작품간 관계를 네트워크 기법으로 분석하였다. 분석결과 에드거 앨런 포의 장르적 이미지와 연관된 작가군, 작가들 간의 관계, 연관 도서가 파악되었다, 이 연구에서 제시한 특정 작가의 이미지, 연관 작가 및 작품 정보를 도출하는 방안은 특정 작가를 중심으로 도서관 독서 프로그램이나 문화 프로그램, 북 큐레이션을 하게 될 경우 활용할 수 있는 도구가 될 것이다.
Many readers tend to read books of a specific author and to expand their reading areas according to the author. This study chose Edgar Allan Poe and analyzed the image of the author using co-recommended authors and books by other readers. The frequencies of co-occurred authors and books were investigated and the relations of authors and books were analyzed with network analysis methods. As a result, genre images of Poe, related authors, and related books are discovered. This study also suggested the methods to identify the image of a author, related author groups, and related books for libraries’ reading programs and book curation.
교육훈련 평가는 교육프로그램과 관련한 내용을 측정, 관찰하여 품질을 평가하고 이를 통해 교육훈련 변경에 대한 근거를 제공하는 행위이다. 국립중앙도서관은 사서교육 훈련프로그램 교육과정의 성과와 질을 제고할 수 있는 평가방법의 도입이 필요한 시점이다. 이에 본 연구는 국립중앙도서관의 사서교육훈련 직무교육의 효과성을 객관적이고 복합적으로 측정할 수 있는 평가모형을 개발하는 것을 목적으로 하였다. 이를 위해 Kirkpatrick의 4단계 평가모형을 적용하였으며, 선행연구, 국립중앙도서관 사서교육훈련 교육과정 현황조사, 이해관계자 요구분석을 실시하였다. 이를 바탕으로 사서교육훈련 평가체계 방향성을 설정하기 위한 평가체계 및 평가도구를 제시하였다. 본 연구 결과는 실제 국립중앙도서관 사서교육훈련과정의 현실적인 평가체계로 활용될 수 있을 것으로 기대된다.
Evaluation of education and training is the act of measuring and observing contents related to an educational program and evaluating its quality; and thereby providing the basis for the changes in the curriculum. The National Library of Korea (NLK) has urgently needed to introduce an evaluation method that can enhance the performance and quality of its continuing education program. Therefore, this study is aimed at developing an evaluation model that can objectively and comprehensively measure the effectiveness of NLK’s job training program for its librarians. To this end, the study applied Kirkpatrick’s 4-Level Training Evaluation Model and conducted review of preceding researches, investigation of NLK’s librarian continuing education program, along with analysis on the stakeholders’ needs. Based on the results, the study suggested evaluation system to establish the directions of the evaluation system. The findings of this study are expected to be used as a practical evaluation system for NLK’s librarian education program.
본 연구에서는 FRBRoo 분석을 바탕으로 FRBR 시리즈 개념모형을 확장하고 개선하기 위한 방안을 제시하고자 했다. FRBRoo는 CIDOC CRM과 연계된 플러그인 온톨로지다. FRBR 모형을 대체하는 것이 아니라 박물관 분야와의 협력을 위해 개발된 것이다. 연구 과정에서 FRBR 시리즈 모형이 IFLA LRM으로 통합 개정되었다. 이에 LRM에 대한 분석도 추가하였다. 서지 정보가 도서관의 업무와 이용자를 지원해야 한다면, 도서관이 당면한 새로운 과제를 지원하기 위해 서지정보를 분석하는 방식도 개선되어야 할 것이다. 이를 위해서는 시간과 관련된 이벤트 개념이 서지정보의 모델링에 반영되어야 한다. 또한 서지정보의 구축과 교환 단위를 서지레코드보다 더 작은 단위나 더 큰 단위로도 확대해야 하며, FRBRoo를 서지정보의 공유를 위한 외부와의 연계 통로로 활용하는 것이 바람직하다.
In this study, based on the analysis of FRBRoo, we tried to propose suggestions to expand and improve the FRBR family conceptual model. FRBRoo is a plug-in ontology of CIDOC CRM with cooperation of museum field. As FRBR family models also revised and integrated into IFLA Library Reference Model, the additional analysis on IFLA LRM was performed. If bibliographic information is required to support the technical and user services of the library, the way to analyze the bibliographic information should be improved in order to cope with the new challenges faced by the library. To do this, time-related event concepts should be reflected in the modeling of bibliographic information. It is also necessary to expand the creation and exchange unit of bibliographic information to smaller units or larger units than legacy bibliographic records. Using FRBRoo as a linkage tool for the sharing of bibliographic information is also suggested.
This study mainly investigates the motivations of YouTube and Flicker users for posting videos or images/photos on each service. The motivational framework with ten factors such as enjoyment, self-efficacy, learning, personal gain, altruism, empathy, social engagement, community interest, reputation and reciprocity were used to test the motivations. Those who are users of YouTube and Flickr were recruited from Amazon Mechanical Turk to participate in online surveys. Findings show that learning and social engagement are the two most highly rated motivations. Altruism was rated relatively low, although it was strongly correlated with all other motivations. Personal gain was rated as the lowest by both users but Flickr users rated personal gain higher than YouTube users. Findings from this study could be applicable to specify user motivations for using the services and to upgrade the designs of the services in the future.
현재와 장래에 이용될 신뢰할 수 있는 디지털 정보를 유지하고, 가치를 부여하는 디지털 큐레이션은 전문도서관에서의 중요한 업무로 인지되기 시작하였다. 본 연구의 목적은 지속적으로 변화하는 디지털정보 환경 하에서 전문도서관이 수행하고 있는 디지털 큐레이션 업무에 대한 전반적인 실태조사와 현재 전문도서관에서 수행되는 큐레이션 업무 수준 및 전문도서관 사서가 인지하는 큐레이션 업무의 중요도 정도를 파악하는데 있다. 이를 위하여 본 연구는 먼저 디지털 큐레이션 프로세스를 대표할 수 있는 활동범주와 이에 해당되는 세부업무를 도출한 후, 이에 대한 전문도서관의 수행정도와 중요정도를 조사하였다. 그 결과, 첫째, 전문도서관의 디지털 큐레이션 활동은 전반적으로 미흡하였고 이에 대한 중요도 인식도 그다지 높지 않음을 알 수 있었다. 둘째, 전문도서관 사서들이 기관으로부터 지원을 받지 못하는 어려움을 겪고 있고 내부적으로는 장기적인 정책 및 업무절차를 수립하지 못하여 체계적인 디지털 큐레이션을 못하고 있으며, 셋째, 사서들은 여전히 도서관의 전통적인 업무 사이클인 정보조직-소장-이용을 중요시 여기고 이 업무들을 중심으로 하여 디지털 큐레이션 활동을 수행하고 있음을 알 수 있었다. 마지막으로 새로운 개념으로 새로운 실무와 기술을 익혀야 수행할 수 있는 디지털 보존에 대한 중요도 인지와 이와 관련된 기술적 역량을 확장시키는 노력이 요구됨을 알 수 있었다.
Digital curation which maintains digital information over time and adds value becomes, nowadays, one of the important business process in the special libraries. This study is to investigate the business practice level of the digital curation in the special libraries and the librarians’ perception on the importancy of digital curation. In results, it is found that most librarian, in general, think that the level of digital curation practice in the special libraries is insufficiency. Also, the study finds that the librarians of special libraries have difficulties in terms of the lack of willingness and funding problems as well as the lack of long-term policies and suitable business procedures; they only focus the cycle of information organization-information storage-information use among the 8 processes of digital curation; they need to recognize the importance of digital preservation as one of the essential process of digital curation and make effort to extend technological capacity of digital preservation.
이 논문은 서비스 품질 관점에서 도서관 모바일 서비스를 위한 평가 모형을 개발하는 것을 목적으로 한다. 이를 위해 본 연구에서는 기존에 연구된 도서관의 서비스 품질 평가 모형과 모바일 서비스 평가 연구에 대한 문헌 분석을 실시하였으며, 이를 토대로 도서관 모바일 서비스 품질 평가에 필요한 4개 품질 차원, 10개 품질 요인, 39개 품질 측정 항목으로 구성된 평가 모형을 개발하였다. 그리고 개발된 모형의 타당성을 검증하기 위해 델파이 기법을 적용하였으며, 최종적으로 4개 품질 차원, 9개 품질 요인, 37개 품질 측정 항목으로 구성된 모형을 도출하였다. 이 연구에서 제안하고 있는 평가 모형은 도서관의 모바일 서비스 품질 진단 도구로 사용될 수 있으며, 또한 도서관 모바일 서비스의 개선을 위한 가이드라인으로도 활용될 수 있다.
This paper aims to develop an evaluation model for library mobile services in terms of service quality. First, a literature review of the service quality evaluation model and the mobile library service evaluation was conducted. Then, based on the analysis, the evaluation model consisting of 4 quality dimensions, 10 quality factors, 39 quality measurement items was developed. Delphi method was applied to verify the validity of the model. Finally, a final model consisting of 4 quality dimensions, 9 quality factors, and 37 quality measurement items was derived. The evaluation model proposed in this study can be used as a measure of library mobile service quality and can be used as a guideline for improvement of library mobile service.
본 연구는 지역방송국들의 기록관리 현황을 분석하고 개선방안을 모색하는 것을 목적으로 한다. 이를 위해 분석의 기준점이 되어 줄 KBS서울총국을 비롯하여 KBS 지역방송국 1곳, MBC 지역방송국 1곳, 지역민방 2곳을 방문하여 담당자와의 면담을 통한 현황 조사를 실시하였다. 분석 결과, 대부분의 지역방송국은 디지털로 생산되어 송출된 방송영상물은 방송국 내 서버를 통해 비교적 체계적으로 보관하고 있는 것으로 나타났다. 그러나 이들은 과거에 생산된 아날로그 자료에 대한 디지털화 작업을 실시하지 않고, 보유 기록물의 수량조차 정확하게 파악하지 못하고 있었다. 게다가 보존설비나 검색장비가 낙후되어 기록물에 대한 기본적인 보존과 이용에 있어서 어려움이 많은 것으로 나타났다. 본 연구에서는 이러한 결과를 바탕으로 방송국 자체 기록관리 규정 마련, 목록 작성을 통한 보유 기록물 수량 파악, 아날로그 기록에 대한 디지털화 작업 실시, PD들에 대한 메타데이터 교육 등의 개선방안을 제안하였다.
This study aims to analyze the current status of records management in local broadcasting stations. To that end, it conducted interviews with personnels in charge of keeping records in KBS in J province, MBC in J province, and 2 local commercial broadcasting stations as well as KBS headquarter. The findings show that the local broadcasting stations keep digital files of born-digital broadcast records in a server in a relatively systematic way. However, they never digitalized their analog records and do not even know the exact volume of total records they own. In addition, they have significant difficulties in preserving and utilizing broadcast records because of outdated preservation facilities and information retrieval systems. Based on the findings, this study suggests ways to improve current broadcast record management such as preparation of record management guidelines, construction of an inventory for owned records, digitalization initiative, and provision of metadata education for PDs, etc.
기록이나 문헌의 자동분류에 관한 연구는 오래 전부터 시작되었다. 최근에는 인공지능 기술이 발전하면서 기계학습이나 딥러닝을 접목한 연구로 발전되고 있다. 이 연구에서는 우선 문헌의 자동분류와 인공지능의 학습방식이 발전해 온 과정을 살펴보았다. 또 기계학습 중 특히 지도학습 방식의 특징과 다양한 사례를 통해 기록관리 분야에 인공지능 기술을 적용해야 할 필요성에 대해 알아보았다. 그리고 실제로 지도학습 방식으로 서울시의 결재문서를 ETRI의 엑소브레인을 통해 정부기능분류체계로 자동분류해 보았다. 이를 통해 기록을 다양한 방식의 분류체계로 자동분류하기 위한 각 과정의 고려사항을 도출하였다.
Research on automatic classification of records and documents has been conducted for a long time. Recently, artificial intelligence technology has been developed to combine machine learning and deep learning. In this study, we first looked at the process of automatic classification of documents and learning method of artificial intelligence. We also discussed the necessity of applying artificial intelligence technology to records management using various cases of machine learning, especially supervised methods. And we conducted a test to automatically classify the public records of the Seoul metropolitan government into BRM using ETRI’s Exobrain, based on supervised machine learning method. Through this, we have drawn up issues to be considered in each step in records management agencies to automatically classify the records into various classification schemes.