
본문 바로가기 주메뉴 바로가기

ACOMS+ 및 학술지 리포지터리 설명회

  • 한국과학기술정보연구원(KISTI) 서울분원 대회의실(별관 3층)
  • 2024년 07월 03일(수) 13:30


검색어: collection, 검색결과: 277
권혜진(동아일보) ; 정동열(이화여자대학교) 2010, Vol.27, No.4, pp.109-130 https://doi.org/10.3743/KOSIM.2010.27.4.109

본 연구의 목적은 기자직의 웹 행동 분석을 통해 웹 정보탐색행위 패턴의 특성을 규명하는 것이다. 이를 위해 본 연구는 기자직 23명을 대상으로 트랜잭션로그를 수집하여 분석하였다. 데이터 수집을 위하여 분석 대상의 컴퓨터에 웹 트래킹 소프트웨어를 설치하였으며, 2주 동안 총 39,860개의 웹 로그가 수집되었다. 세션의 시작과 종료 패턴, 단계별 이행 패턴, 순차규칙 모형이 분석되었으며, 기자직과 일반인의 웹 이용 패턴을 비교하였다. 이를 토대로 기자직의 웹 정보탐색행위 패턴을 사실확인형 탐색, 사실확인형 검색, 조사형 탐색, 조사형 검색 등 4가지 형태로 유형화하였다.


The purpose of this study is to identify th patterns in the news reporters’ information seeking behaviors by observing their web activities. For this purpose, transaction logs collected from 23 news reporters were analyzed. Web tracking software was installed to collect the data from their PCs, and a total of 39,860 web logs were collected in two weeks. Start and end pattern of sessions, transitional pattern by step, sequence rule model was analyzed and the pattern of Internet use was compared with the general public. the analysis of pattern derived a web information seeking behavior modes that consists of four types of behaviors: fact-checking browsing, fact-checking search, investigative browsing and investigative search.

한종엽(한국해양과학기술원) ; 서만덕(한국해양과학기술원) 2014, Vol.31, No.1, pp.163-187 https://doi.org/10.3743/KOSIM.2014.31.1.163

이 연구의 목적은 해양과학기술 분야 연구자의 정보이용행태를 규명하기 위한 것으로, 연구자의 연령, 학력, 연구분야 등 개인적 특성에 따른 차별화된 정보서비스 수립과 전문도서관 서비스 고도화를 위한 기초자료를 확보하는데 있다. 자료수집은 2014년 1월 중 2주간 국내의 대표적인 해양연구기관 소속 연구자 348명을 대상으로 웹설문지를 배포하고 최총 115명의 데이터를 회수하였다. 분석결과, 연구자가 가장 선호하는 정보유형은 학술논문이며, 국내자료보다 해외자료, 인쇄자료보다 전자자료를 주로 이용하고 있다. 정보입수경로는 ‘인터넷정보원’과 ‘소속 도서관 이용’이 높았고, 자료 수집 시 겪는 문제점은 ‘소속도서관의 전자자원 다양성 부족’과 ‘유료정보에 대한 이용부담’에 대한 의견이 가장 많았다. 도서관 만족도의 주요 영향요인은 ‘전자도서관 시스템’, ‘도서관 직원’, ‘도서관 소장자료’ 순으로 나타났고, 이는 정보이용 만족도와 밀접한 관계가 있음을 보여준다. 마지막으로 전문도서관 정보서비스의 수요를 분석한 결과, 향후 중점적으로 실시해야하는 서비스는 ‘맞춤형 정보검색서비스’, ‘프로젝트지원서비스’, ‘연구동향분석서비스’로 나타났다.


The purpose of this study is to explain information usage behavior of researchers in the field of ocean science and technology. The study mainly collected primary data for advancement of special library services as well as establishment of personalized information services based on personal characteristics such as age, education level, and area of research. The data collection was conducted for two weeks during January 2014, through a web survey to 348 researchers in national ocean research institutions in South Korea. Total of 115 researchers replied. The analysis showed that the most preferred type of information medium was a scholarly journal. Researchers used more foreign published journals compared to Korean ones, while favoring digital formats rather than printed ones. The top channels for information collection were ‘web search’ and ‘affiliated libraries.’ Most pointed out difficulties of data collection were ‘lack of variety of digital resources in affiliated libraries’ and ‘reluctance to use charged information.’ Key elements for satisfactory user experience were ranked in the order of ‘digital library system,’ ‘library staff,’ and ‘library collection’ and so on, which proves the close relationship between library service and information usage service satisfaction. The result of an assessment for demands in special libraries showed that ‘personalized information search service,’ ‘project support service,’ and ‘research direction analysis service’ should be implemented in the future.

유호선(전북대학교) ; 오효정(전북대학교) 2018, Vol.35, No.2, pp.115-139 https://doi.org/10.3743/KOSIM.2018.35.2.115

재난 웹 기록물의 가치와 보존의 중요성으로 인해 전 세계적으로 재난 아카이브의 구축은 국가적인 과제가 되어가고 있다. 본 연구는 재난 아카이브의 웹 기록물 수집에 있어서 이슈 생존 주기 모형에 기반한 수집 방안을 제시하는 것을 목적으로 한다. 이를 위해 먼저 국내외 재난 아카이브의 웹 기록물 수집 현황, 수집 방법 및 기간에 대하여 분석하였다. 또한, 최근 10년간 발생한 재난 이슈를 수집 및 분석하여 이슈 생존 주기 모형을 도출하였다. 이슈 생존 주기 모형은 재난의 특성에 따라 돌발형 및 주기형으로 구분되며, 각 모형에 따른 웹 기록물 수집 방안을 제시하였고 적용 가능성을 검증하였다.


Due to the value and the importance of preservation of disaster web records, to build disaster archives is globally becoming a national challenge. This study proposes a acquisition methods based on the issue life cycle model for collecting disaster web records. We firstly analyzed web records acquisition status, methods and period of domestic and foreign disaster archives. In addition, the issue life cycle model was derived by collecting and analyzing the disaster issues in the last 10 years. As the results of the analysis, the issue life cycle model was divided into the sudden type and periodic type according to the characteristics of the disaster. In conclusion, this study propose a method to collect web records according to each model and verify its applicability.

이준호(숭실대학교) ; 권혁성(숭실대학교) ; 박소연() 2003, Vol.20, No.2, pp.27-41 https://doi.org/10.3743/KOSIM.2003.20.2.027

이용자와 검색 서비스 시스템의 모든 검색 과정을 기록한 질의 로그는 이용자의 실제 검색 행위를 사실적으로 반영한다. 따라서, 웹 검색 이용자들의 검색 행태를 이해하기위하여 웹 검색 서비스 시스템이 생성한 질의 로그를 분석하는 방법이 널리 사용되고 있다. 본 연구는 네이버 이용자의 웹 검색 행태를 파악하기 위하여 기존의 질의 로그 분석 방법론을 보완하여 제시한다. 또한, 본 연구는 통합 검색, 디텍토리 검색, 웹 문서 검색과 같은 다양한 검색 유형에 대하여 일주일 동안 생성된 질의 로그를 분석함으로써 네이버 웹 검색 이용자들의 전반적인 검색 행태를 파악하였다. 본 연구의 결과는 보다 효과적인 웹 검색 시스템 개발과 서비스 구축에 기여할 것으로 기대된다.


Query logs are online records that capture user interactions with information retrieval systems and all the search processes. Query log analysis offers an advantage of providing reasonable and unobtrusive means of collecting search information from a large number of users. In this paper, query logs of NAVER, a major Korean Internet search service, were analyzed to investigate the information seeking behavior of NAVER users. The query logs were collected over one week from various collections such as comprehensive search, directory search and web document search. It is expected that this study could contribute to the development and implementation of more effective web search systems and services.


2016년 1월 1일부터 공공도서관 빅데이터 플랫폼이 서비스되기 시작하여 도서관 빅데이터가 공공도서관 업무 개선에 활용되고 있다. 본 논문은 도서관 빅데이터 플랫폼 활용사례들을 살펴보고 도서관 빅데이터 플랫폼의 활용효과를 높일 수 있는 개선방안을 도출하고자 한다. 이를 위해 먼저, 도서관 빅데이터 플랫폼을 활용한 사례들에서 활용한 빅데이터와 활용유형분석 및 도출된 서비스/시행정책을 살펴본다. 다음으로, 현재 공공도서관에서 사용하는 통합도서관리시스템(ILUS)과 도서관 빅데이터 플랫폼 각각의 자료분석 방식을 비교함으로써 도서관 빅데이터 플랫폼의 한계점과 이점을 살펴본다. 사례분석 결과, 프로그램 기획 및 수행, 장서, 수서, 기타의 유형으로 빅데이터를 활용하였고 서비스/시행정책은 이용자 맞춤형 테마서가 및 독서진흥프로그램 진행, 장서활용도 증대, 특화주제에 기반한 수서 및 대출현황 데이터 공개로 요약되었다. 비교분석결과, ILUS는 자관의 자료실현황분석에 특화되어 있으며, 빅데이터 플랫폼은 다양한 속성(연령, 성별, 지역, 대출시기 등)에 따른 선택적 분석이 가능하여 분석시간단축과 유연한 분석이 가능하다. 마지막으로 사례분석과 비교분석에서 밝혀진 특징 및 한계점을 정리하고 개선방안을 제시한다.


Since big data platform services for the public library began January 1, 2016, libraries have used big data to improve their work performance. This paper aims to examine the use cases of library big data and attempts to draw improvement plan to improve the effectiveness of library big data. For this purpose, first, we examine big data used while utilizing the library big data platform, the usage pattern of big data and services/policies drawn by big data analysis. Next, the limitations and advantages of the library big data platform are examined by comparing the data analysis of the integrated library management system (ILUS) currently used in public libraries and data analysis through the library big data platform. As a result of case analysis, big data usage patterns were found program planning and execution, collection, collection, and other types, and services/policies were summarized as customizing bookshelf themes for the book curation and reading promotion program, increasing collection utilization, and building a collection based on special topics. and disclosure of loan status data. As a result of the comparative analysis, ILUS is specialized in statistical analysis of library collection unit, and the big data platform enables selective and flexible analysis according to various attributes (age, gender, region, time of loan, etc.) reducing analysis time. Finally, the limitations revealed in case analysis and comparative analysis are summarized and suggestions for improvement are presented.

서하림(연세대학교 문헌정보학과 석사) ; 송민(연세대학교 문헌정보학과 교수) 2019, Vol.36, No.4, pp.207-226 https://doi.org/10.3743/KOSIM.2019.36.4.207

우울증은 전 세계적으로 많은 사람들이 겪고 있으며, 최근 다양한 분야에서 꾸준히 우울증에 대한 연구가 수행되고 있다. 특히 사람들이 본인의 스트레스나 감정 상태에 대해 소셜미디어에 공유한 글을 통해 그들의 심리나 정신건강에 대해 파악해보고자 하는 맥락에서 소셜미디어를 활용한 연구 역시 유의미하게 받아들여지고 있다. 이에 본 연구에서는 우울 경향의 이용자와 그렇지 않은 이용자들의 2016년부터 2019년 2월까지의 트위터 데이터를 수집하여 어떤 주제적, 어휘 사용의 특성을 보이는지 보고자 하였으며, 우울 경향의 시기별로도 어떤 차이를 보이는지 살펴보기 위해 우울 경향 관측 날짜를 기준으로 하여 이전(before) 시기와 이후(after) 시기를 구분하여 실험을 수행하였다. 토픽모델링, 동시출현 단어분석, 감성분석 방법을 통해 우울 경향과 비(非)우울 경향 이용자의 텍스트의 주제적 차이를 살펴보았고, 감성 반응에 따라 사용한 어휘에 대해서도 살펴봄으로써 어떠한 특성이 있는지 확인해 보았다. 데이터 수집 단계에서 ‘우울’ 표현을 포함한 텍스트 데이터 수집방법을 통해 비교적 긴 기간, 많은 양의 데이터를 수집할 수 있었고, 또한 우울 경향의 여부와 시기적 구분에 따른 관심 주제에 대한 차이도 확인할 수 있었다는 점에서 유의미하다고 볼 수 있다.


Depression is a serious psychological disease that is expected to afflict an increasing number of people. And studies on depression have been conducted in the context of social media because social media is a platform through which users often frankly express their emotions and often reveal their mental states. In this study, large amounts of Korean text were collected and analyzed to determine whether such data could be used to detect depression in users. This study analyzed data collected from Twitter users who had and did not have depressive tendencies between January 2016 and February 2019. The data for each user was separately analyzed before and after the appearance of depressive tendencies to see how their expression changed. In this study the data were analyzed through co-occurrence word analysis, topic modeling, and sentiment analysis. This study’s automated data collection method enabled analyses of data collected over a relatively long period of time. Also it compared the textual characteristics of users with depressive tendencies to those without depressive tendencies.

최정원(전북대학교) ; 강주연(전북대학교 기록관리학과) ; 박준형(전북대학교) ; 오효정(전북대학교) 2016, Vol.33, No.2, pp.135-156 https://doi.org/10.3743/KOSIM.2016.33.2.135

최근 이용자 중심의 기록관리에 대한 중요도가 높아짐에 따라, 공공기록관에서도 소셜 네트워크 서비스(Social Network Service: 이하 SNS)를 통해 기존 방식인 단방향이 아닌 쌍방향 활동으로 이용자와 소통을 유도하여 이용자 중심 서비스를 시도하고 있다. 본 연구의 목적은 공공기록관의 소셜미디어 이용 현황을 분석하고 그에 대한 이용자들의 관심도를 파악하는데 있다. 이를 위해 본 연구에서는 국가기록원과 대통령기록관 트위터를 선정, 2010년부터 2016년 4월 15일까지의 공공기록관과 관련 트윗(tweet)들을 수집하였고, 계량분석과 소셜미디어 분석 방법(노출추이분석, 시계열분석)을 적용하였다. 공공기록관에서 자체적으로 게시한 트윗과 일반 사용자가 게시한 트윗 집합간의 차이점을 분석하고, 공공기록관에 대한 이용자 관심이슈와 시계열에 의한 사회적 이슈간의 상관관계를 파악하였으며, 이를 통해 효과적인 소셜미디어 환경에서의 공공기록관 서비스 활용 방안을 제시한다.


Recently, as the importance of user-oriented archives management is becoming increasingly, government archives try to serve interactive services using social network service (SNS) beyond one-way approaches. This study aims to analyze usage of government archives service in social media and examine users’ interestedness. We especially select “National Archives of Korea” and “Presidential Archives” as target government archives and collect tweets from 2010 to 15th April 2016. Our study adopts informetric approaches and social media analysis including buzz analysis, time series analysis. We differentiate between the tweet collection posted by government archives themselves and the other collection generated by general users. Furthermore we conduct correlation analysis of tweet and social issues and propose application plan for government archives services in social media environment.

강윤호(대림대학 문헌정보과) ; 박영애(경기대학교 문헌정보학과) 2009, Vol.26, No.3, pp.417-434 https://doi.org/10.3743/KOSIM.2009.26.3.417

국가도서관통계시스템에서 요구하는 통계항목들은 이론적 견지에서 보면 도서관평가 또는 도서관운영 정책수립을 위해 필요한 데이터를 기반으로 한 항목들이라고 할 수 있다. 그러나 국가도서관통계시스템에서 요구하는 통계항목과 공공도서관현장에서 일반적으로 수집될 수 있는 통계항목들과는 차이가 있음을 알 수 있다. 따라서 공공도서관 평가로 활용되고 있는 국가도서관통계가 신뢰할 수 있는 또는 타당성이 있는 객관적 데이터인지를 알아보기 위하여, 공공도서관 현장에서 통계를 수집할 수 있는 근거자료인 도서관 업무(운영)일지의 항목들을 분석하고 아울러 통계의 자동수집이 가능한 도서관리 프로그램에 대한 공공도서관에서의 사용 현황을 조사하였다. 이 연구의 분석 자료는 향후 공공도서관 업무(운영)일지의 표준안 마련을 위한 기초 자료로 활용될 것이다.


Statistics items required by National Library Statistics System are based on data for library evaluation and policy making of library management from a theoretical standpoint. However, It is realized there are differences between Statistics items required by National Library Statistics System and those can be collected at the field of public libraries. In accordance with this point, this paper contained an analysis of a working diary log of public libraries as a basic material able to collect data at the field of public libraries and also surveyed the present usage situation of Library Management Program able to automatically collect data to recognize that National Library Statistics is reliably or validly objective data. An analysis data of this research will be a basic material to plan the standard guide of a working diary log of public libraries from now on.

정우진(성균관대학교 문헌정보학과) ; 김규리(성균관대학교 문헌정보학과) ; 유승희(성균관대학교) ; 주영준(성균관대학교) 2021, Vol.38, No.4, pp.113-128 https://doi.org/10.3743/KOSIM.2021.38.4.113

본 연구는 코로나바이러스감염증-19(이하 코로나바이러스) 백신에 대한 사회적 의견을 파악하기 위해 트위터에서 작성된 백신 관련 게시물들을 분석하였다. 2020년 3월 16일부터 2021 3월 15일까지 1년간 트위터에서 작성된 코로나바이러스 백신 이름을 키워드로 포함한 45,413개의 게시물을 수집하여 분석하였다. 데이터 수집을 위해 활용된 코로나바이러스 백신 키워드는 총 12개이며, 수집된 게시물 수순으로 ‘화이자’, ‘아스트라제네카’, ‘모더나’, ‘얀센’, ‘노바백스’, ‘시노팜’, ‘시노백’, ‘스푸트니크’, ‘바라트’, ‘캔시노’, ‘추마코프’, ‘벡토르’이다. 수집된 게시물들은 수기와 자동화된 방법을 동시 활용하여 키워드 분석, 감성 분석, 및 토픽모델링을 통하여 백신들에 대한 의견을 탐색하였다. 연구결과에 따르면 전반적으로 백신에 대한 부정적인 반응이 많았으며, 백신 접종 후유증에 대한 불안 및 백신의 효능에 대한 불신이 백신들에 대한 부정적인 주요 요소로 파악되었다. 이와는 반대로, 백신 접종에 따른 코로나바이러스 확산 억제에 대한 기대감이 백신에 대한 긍정적인 사회적 요소인 것을 확인할 수 있었다. 본 연구는 기존의 선행연구들이 뉴스 등 대중매체 데이터를 통해 코로나바이러스 백신에 대한 사회적 분위기를 파악하고자 했던 것과 달리, 소셜 미디어 데이터 수집 및 이를 활용한 키워드 분석, 감성 분석, 토픽 모델링 등의 여러 분석방법들을 사용하여 대중들의 의견을 파악하는 것으로 학술적 의의를 지닌다. 또한, 본 연구의 결과는 백신에 대한 사회적 분위기를 반영한 백신 접종 권장 정책 수립 기여라는 실질적 함의를 시사한다.


In this study, we aimed to understand the public opinion on COVID-19 vaccine. To achieve the goal, we analyzed COVID-19 vaccine-related Twitter posts. 45,413 tweets posted from March 16, 2020 to March 15, 2021 including COVID-19 vaccine names as keywords were collected. The 12 vaccine names used for data collection included ‘Pfizer’, ‘AstraZeneca’, ‘Modena’, ‘Jansen’, ‘NovaVax’, ‘Sinopharm’, ‘SinoVac’, ‘Sputnik V’, ‘Bharat’, ‘KhanSino’, ‘Chumakov’, and ‘VECTOR’ in the order of the number of collected posts. The collected posts were analyzed manually and automatedly through keyword analysis, sentiment analysis, and topic modeling to understand the opinions for the investigated vaccines. According to the results, there were generally more negative posts about vaccines than positive posts. Anxiety about the aftereffects of vaccination and distrust in the efficacy of vaccines were identified as major negative factors for vaccines. On the contrary, the anticipation for the suppression of the spread of coronavirus following vaccination was identified as a positive social factor for vaccines. Different from previous studies that investigated opinions about COVID-19 vaccines through mass media data such as news articles, this study explores opinions of social media users using keyword analysis, sentiment analysis, and topic modeling. In addition, the results of this study can be used by governmental institutions for making policies to promote vaccination reflecting the social atmosphere.


공공데이터의 개방과 제공의 활성화와 함께, 공공도서관이 업무 중에 생산한 서지 데이터와 대출 이력과 같은 데이터가 도서관 공공데이터로 제공되고 있다. 본 논문은 도서관 공공데이터의 품질을 진단하고, 그 결과를 바탕으로 도서관 공공데이터의 품질을 높일 개선방안을 제안하고자 한다. 먼저, 문헌정보학 영역에서 공공데이터에 관해 이루어진 연구를 개괄한다. 그다음으로, 도서관 공공데이터 개방 플랫폼인 도서관 정보나루의 오픈 API를 통해 확보한 도서관 공공데이터의 완전성과 정확성을 진단한다. 마지막으로, 데이터 품질 진단 결과에 바탕을 개선방안을 도출한다. 완전성을 진단한 결과, 도서의 식별과 검색을 위 필수적인 서지 요소에서 다수의 공백이 확인되었다. 정확성을 진단한 결과, 값의 유형, 값의 범위, 제한조건을 따르지 않는 부정확한 서지 요소가 확인되었다. 본 연구는 데이터 품질 진단 분석 결과를 바탕으로, 도서관 정보나루의 데이터 수집 절차 개선, 데이터별 스키마 구축, 데이터 수집과 데이터 처리에 관한 안내 제공, 원자료 공개를 제언하였다.


With the popularization of open government data, Library-related open government data is also open and utilized to the public. The purpose of this paper is to diagnose the quality of library-related open government data and propose improvement measures to enhance the quality based on the diagnosis result. As a result of diagnosing the completeness of the data, a number of blanks are identified in the bibliographic elements essential for identifying and searching a book. As a result of diagnosing the accuracy of the data, the bibliographic elements that are not compliant with the data schema have been identified. Based on the result of data quality diagnosis, this study suggested improving the data collection procedure, establishing data set schema, providing details on data collection and data processing, and publishing raw data.
