바로가기메뉴

본문 바로가기 주메뉴 바로가기

logo

검색어: 정보검색, 검색결과: 162
131
최윤수(한국과학기술정보연구원) ; 정창후(한국과학기술정보연구원) ; 조현양(경기대학교) 2011, Vol.28, No.1, pp.89-104 https://doi.org/10.3743/KOSIM.2011.28.1.089
초록보기
초록

대용량 문서에서 정보를 추출하는 작업은 정보검색 분야뿐 아니라 질의응답과 요약 분야에서 매우 유용하다. 정보추출은 비정형 데이터로부터 정형화된 정보를 자동으로 추출하는 작업으로서 개체명 인식, 전문용어 인식, 대용어 참조해소, 관계 추출 작업 등으로 구성된다. 이들 각각의 기술들은 지금까지 독립적으로 연구되어왔기 때문에, 구조적으로 상이한 입출력 방식을 가지며, 하부모듈인 언어처리 엔진들은 특성에 따라 개발 환경이 매우 다양하여 통합 활용이 어렵다. 과학기술문헌의 경우 개체명과 전문용어가 혼재되어 있는 형태로 구성된 문서가 많으므로, 기존의 연구결과를 이용하여 접근한다면 결과물 통합과정의 불편함과 처리속도에 많은 제약이 따른다. 본 연구에서는 과학기술문헌을 분석하여 개체명과 전문용어를 통합 추출할 수 있는 기반 프레임워크를 개발한다. 이를 위하여, 문장자동분리, 품사태깅, 기저구인식 등과 같은 기반 언어 분석 모듈은 물론 이를 활용한 개체명 인식기, 전문용어 인식기를 개발하고 이들을 하나의 플랫폼으로 통합한 과학기술 핵심개체 인식 체계를 제안한다.

Abstract

Large-scaled information extraction plays an important role in advanced information retrieval as well as question answering and summarization. Information extraction can be defined as a process of converting unstructured documents into formalized, tabular information, which consists of named-entity recognition, terminology extraction, coreference resolution and relation extraction. Since all the elementary technologies have been studied independently so far, it is not trivial to integrate all the necessary processes of information extraction due to the diversity of their input/output formation approaches and operating environments. As a result, it is difficult to handle scientific documents to extract both named-entities and technical terms at once. In order to extract these entities automatically from scientific documents at once, we developed a framework for scientific core entity extraction which embraces all the pivotal language processors, named-entity recognizer and terminology extractor.

132
김희섭(경북대학교) ; 서지웅(경북대학교) ; 이미숙(경북대학교) 2014, Vol.31, No.1, pp.299-317 https://doi.org/10.3743/KOSIM.2014.31.1.299
초록보기
초록

본 연구는 대학생들의 성격유형에 따라 인터넷 정보활동과 삶의 만족도에는 어떤 영향을 미치는지를 분석하는데 목적을 두고 있다. 연구목적을 위하여 인터넷 정보활동을 하고 있는 대구지역에 거주하는 대학생들을 대상으로 인구통계학적 특성과 MBTI 성격유형, 그리고 인터넷 정보활동과 관련된 질문을 포함한 총 38개의 항목으로 이루어진 자체 설문지를 사용하여 데이터를 수집하였다. 전체 480명의 응답자 중 유효한 102명의 데이터는 SPSS Ver. 18.0의 다중회귀분석을 통하여 분석하였다. 분석결과 외향적, 감각적, 사고적, 감정적 성격을 가진 대학생들은 인터넷 온라인게임을 통하여 그들의 삶의 만족도가 높아지는 경향을 보였다. 한편 내향적, 감각적, 직관적, 사고적, 감정적 성격을 가진 대학생들은 인터넷 정보검색을 통하여 그들의 삶의 만족도가 낮아지는 경향을 보였다. 또한 외향적, 직관적, 감정적 성격을 가진 대학생들은 스마트폰메신저 활동을 통하여 그들의 삶의 만족도가 낮아지는 경향을 보였다.

Abstract

The objective of this study is to analyse the college students’ Internet information activities and life satisfaction with their personality types. For this study, data were collected using self-designed questionnaire which included the items of college students’ demographic information, MBTI personality types, and their information activities of the Internet. Total of 480 data were collected and 102 valid data were analysed with the multiple regression using SPSS version 18.0. It was found that extraversion, sensing, thinking, and feeling types of college students were tend to show the higher of their life satisfaction through the online game; introversion, sensing, intuition, thinking, and feeling types of college students were tend to show the lower of their life satisfaction through the internet retrieval; and extraversion, intuition, and feeling types of college students were tend to show the lower of their life satisfaction through the smart-phone messenger use.

133
하승록(명지대학교 기록정보과학전문대학원 기록관리전공) ; 임진희(서울특별시청) ; 이해영(명지대학교) 2017, Vol.34, No.1, pp.341-371 https://doi.org/10.3743/KOSIM.2017.34.1.341
초록보기
초록

웹을 통해 제공되는 서비스는 현재 문서중심에서 데이터 중심으로 변화를 겪고 있으며, 그 변화의 중심에는 Linked Open Data(LOD)가 존재한다. 본 연구는 이러한 흐름에 부응하여 기록정보의 LOD 구축을 위한 구체적인 절차와 방법을 살펴보고자 하였다. 또한 소규모 아카이브의 서비스 지속가능성을 염두에 두고, 오픈소스 소프트웨어를 활용하여 LOD 구축 절차를 진행하는 범례를 제시하고자 했다. 이에 본 연구에서는 LOD 구축을 위한 5단계의 프레임워크를 제안했다. 그리고 일상아카이브인 ‘인간과 기억 아카이브’의 일기 기록물 컬렉션을 수집하여, 제안된 5단계 프레임워크에 따라 오픈소스 소프트웨어인 Protege와 Apache Jena Fuseki를 활용하여 POC(Proof of concept)를 진행하였다. 오픈소스를 활용하여 기록정보의 LOD를 구축한 뒤, 상호연결(Interlinking)과 SPARQL 검색을 통해서 외부 LOD와 연결되는 모습을 확인할 수 있었다. 또한 기록정보의 LOD 구축 절차 진행과정의 경험을 바탕으로 내용정보 기술의 품질 향상, 아키비스트의 역량 고도화, 기록정보의 접근성 향상을 위한 상호연결 고도화, LOD 서비스의 수준 결정, LOD 구축을 위한 도구 선정 등, 기록관 LOD 구축을 위한 필요요건을 제시했다.

Abstract

Recently, the web service environment has changed from document-centered to data-oriented focus, and the Linked Open Data(LOD) exists at the core of the new environment. Specific procedures and methods were examined to build the LOD of records information in accordance with this trend. With the service sustainability of small-scale archive in consideration, an exemplification on LOD building process by utilizing open source software was developed in this paper. To this end, a 5-step service framework for LOD construction was proposed and applied to a collection of diary records from ‘Human and Memory Archive’. Proof of Concept(POC) utilizing open source softwares, Protege and Apache Jena Fuseki, was conducted according to the proposed 5 step framework. After establishing the LOD of record information by utilizing the open source software, the connection with external LOD through interlinking and SPARQL search has been successfully performed. In addition, archives’ considerations for LOD construction, including improvement on the quality of content information, the role of the archivist, were suggested based on the understanding obtained through the LOD construction process of records information.

134
한종엽(한국해양과학기술원) ; 서만덕(한국해양과학기술원) 2014, Vol.31, No.1, pp.163-187 https://doi.org/10.3743/KOSIM.2014.31.1.163
초록보기
초록

이 연구의 목적은 해양과학기술 분야 연구자의 정보이용행태를 규명하기 위한 것으로, 연구자의 연령, 학력, 연구분야 등 개인적 특성에 따른 차별화된 정보서비스 수립과 전문도서관 서비스 고도화를 위한 기초자료를 확보하는데 있다. 자료수집은 2014년 1월 중 2주간 국내의 대표적인 해양연구기관 소속 연구자 348명을 대상으로 웹설문지를 배포하고 최총 115명의 데이터를 회수하였다. 분석결과, 연구자가 가장 선호하는 정보유형은 학술논문이며, 국내자료보다 해외자료, 인쇄자료보다 전자자료를 주로 이용하고 있다. 정보입수경로는 ‘인터넷정보원’과 ‘소속 도서관 이용’이 높았고, 자료 수집 시 겪는 문제점은 ‘소속도서관의 전자자원 다양성 부족’과 ‘유료정보에 대한 이용부담’에 대한 의견이 가장 많았다. 도서관 만족도의 주요 영향요인은 ‘전자도서관 시스템’, ‘도서관 직원’, ‘도서관 소장자료’ 순으로 나타났고, 이는 정보이용 만족도와 밀접한 관계가 있음을 보여준다. 마지막으로 전문도서관 정보서비스의 수요를 분석한 결과, 향후 중점적으로 실시해야하는 서비스는 ‘맞춤형 정보검색서비스’, ‘프로젝트지원서비스’, ‘연구동향분석서비스’로 나타났다.

Abstract

The purpose of this study is to explain information usage behavior of researchers in the field of ocean science and technology. The study mainly collected primary data for advancement of special library services as well as establishment of personalized information services based on personal characteristics such as age, education level, and area of research. The data collection was conducted for two weeks during January 2014, through a web survey to 348 researchers in national ocean research institutions in South Korea. Total of 115 researchers replied. The analysis showed that the most preferred type of information medium was a scholarly journal. Researchers used more foreign published journals compared to Korean ones, while favoring digital formats rather than printed ones. The top channels for information collection were ‘web search’ and ‘affiliated libraries.’ Most pointed out difficulties of data collection were ‘lack of variety of digital resources in affiliated libraries’ and ‘reluctance to use charged information.’ Key elements for satisfactory user experience were ranked in the order of ‘digital library system,’ ‘library staff,’ and ‘library collection’ and so on, which proves the close relationship between library service and information usage service satisfaction. The result of an assessment for demands in special libraries showed that ‘personalized information search service,’ ‘project support service,’ and ‘research direction analysis service’ should be implemented in the future.

135
윤화묵(한국과학기술정보연구원) ; 정회경(배재대학교) ; 김창수(연세대학교) ; 유범종(한국과학기술정보연구원) 2002, Vol.19, No.4, pp.96-111 https://doi.org/10.3743/KOSIM.2002.19.4.096
초록보기
초록

현재 기관이나 조직 내에 수많은 양의 데이터가 축적되어 존재하고 있으나 대부분의 데이터는 각 기관이나 조직에 따라 정형화된 형태로 남아있는 실정이다. 정형화된 정보는 정보의 교환 및 공유에 어려움이 있다. 이러한 단점을 극복하고자 지식정보자원관리라는 새로운 개념이 도입되었으며, 축적된 데이터들을 공유 및 관리하기 위한 지식정보자원의 디지털화가 실행되고 있다. 특히 과학기술 또는 교육학술 분야에서는 지식정보자원의 교환 및 공유에 필요한 데이터를 구조적으로 처리하고자 XML을 도입하려는 움직임이 일고 있으며, 이들 분야의 전자문서 안에 사용되어지는 수많은 수학식의 표현이 이미지나 텍스트 등의 비구조적인 데이터로 처리됨에 따라 검색과 인덱싱 또는 재사용성 등의 제한사항이 발생하게 된다. 이를 극복하고자 MathML을 이용한 수학식의 처리에 관심이 집중되고, MathML을 구조적인 문서상에 쉽고 효율적으로 처리할 수 있는 솔루션이 요구되고 있는 실정이다. 이에 본 논문에서는 지식정보자원을 목적으로 하는 전자문서의 구조적인 처리를 용이하게 하고, MathML에 대한 전문적인 지식이 없어도 구조적인 문서상에 쉽게 MathML을 생성 및 표현할 수 있는 XML 문서 편집 시스템을 구현하였다.

Abstract

A lot of accumulated data of many quantity exist within a institution or an organization, but most data is remained in form of standardization as each institution or organization. There are difficulty in exchange and share of information. New concept of knowledge information resource management to overcome this disadvantage was introduced, and the digitization of knowledge information resources to share and manage accumulated data is been doing. Specially, in science technic or education scholarship it, the tendency that importing XML to process necessary data to exchange and share of knowledge information resources structurally, and limitation of back for search and indexing or reusability is happened according as expression of great many mathematics used inside electron document of these sphere is processed to nonstructural data of image or text and so on. There is interest converged in processing of mathematics that use MathML to overcome this, and we require the solution to be able to process MathML easily and efficiently on structural document. In this paper, designed and implemented of XML document editing system which easy structural process of electronic document for knowledge information resources, and create and express MathML easily on structural document without expert knowledge about MathML.

136
김미설(전남대학교 대학원 문헌정보학과) ; 장우권(전남대학교) 2015, Vol.32, No.1, pp.171-204 https://doi.org/10.3743/KOSIM.2015.32.1.171
초록보기
초록

이 연구는 국내 전문학술지를 통해 국내 도서관마케팅의 도입 시기부터 현재까지 관련연구의 시대적 흐름에 따른 변화와 앞으로의 연구동향을 살펴보고, 향후 도서관마케팅 관련 주제 분야의 연구에 도움이 되는 기초 자료를 제시하는 데 있다. 이를 위해 문헌정보학 분야 전문 학술지인 ‘한국문헌정보학회지’, ‘한국비블리아학회지’, ‘한국도서관․정보학회지’, ‘정보관리학회지’의 창간호부터 2013년까지 발행된 전체논문 3,951편 중 선택된 키워드로 검색하여 중복된 논문 및 도서관마케팅과 관련이 없는 논문을 제외하고 최종 선정된 359편의 논문을 대상으로 항목별 세부분석을 통해 연구결과를 도출하였다. 이 연구의 결과, 연고별 연구논문 발표 추이, 기관별 연구논문 발표추이, 저자별 연구논문 발표추이, 영역별 연구논문 발표추이, 관종별 연구논문 발표추이가 나타났다.

Abstract

The objectives of this study are to examine changes in research on library marketing promotion from its introduction to the present using domestic journals carrying research papers on library marketing, to forecast research trends in the future, and to provide basic information for supporting future studies on subjects related to library marketing. There were a total of 3,951 papers published through the journals in the area of library and information science including ‘The Journal of the Korean Society for Library and Information Science’, ‘The Journal of the Korea Biblia Society for Library and Information Science’, ‘The Journal of the Korean Library and Information Science Society’, and ‘The Journal of the Korean Society for Information Management’ from their first issues to the present. These papers were searched using selected keywords, and after redundant papers and those not related to library marketing were excluded, 359 papers were sampled for this study and analyzed from different aspects. Findings derived from this study, with regard to trends in research paper publishing by year, with regard to trends in research paper publishing by institution, with regard to trends in research paper publishing by author, with regard to trends in research paper publishing by area, and with regard to trends in research paper publishing by library type.

초록보기
초록

이 연구는 통합 목록/메타데이터 시스템으로 전 세계에 광범위한 서비스가 제공되고 있는 OCLC의 Connexion 시스템에 관한 유저빌러티를 실험한 연구이다. 유저빌러티 실험은 상업적인 성공을 달성하기 위한 기업들의 노력의 하나로써 시작되었으며 문헌정보학에는 특정한 정보 검색 시스템이 자신의 이용자들에게 좀 더 나은 서비스를 제공하기 위해 시스템 인터페이스를 개선시키고자하는 노력의 일환으로 도입되어 사용되어 왔다. Connexion 서비스는 기본적으로 MARC 기준을 바탕으로 인코딩 되어 메타데이터 서비스를 통합하여 제공하는 대표적인 통합 목록/메타데이터 서비스로 알려져 있다. 실험 전반을 통해서 이용자의 실험과정이 녹화 분석 되었으며, 6개 영역 17 가지 사항의 유저빌러티 문제점들이 파악되었다. 또한 마지막으로 17 가지 사항들에 대한 각각의 개선책들이 조심스럽게 제안되었다.

Abstract

The goal of this study was to examine the relationships between usability and the searching experience, and to uncover where an integrated cataloging and metadata system lay the usability problems of its primary users, catalogers. This study showed that the most important aspect of usability in Connexion lay in the experience of information retrieval system. Also, it showed there are seventeen usability problems to be improved in Connexion. Needless to say, it is most important to note that usability is not an exclusive goal of such an integrated cataloging and metadata system. Other goals such as quality of catalogs, and the reliability of its cataloging and metadata system are equally its concern. This study also suggested more testing on diverse cataloging systems and specific user groups, especially catalogers.

초록보기
초록

이미지 색인은 이미지 정보로의 접근에 핵심적인 역할을 수행하는 부분으로 다양한 이미지 색인 방법 및 시스템이 이미지 정보의 종류에 따라 소개되어 왔다. 이미지 색인은 Panofsky의 정보의 단계별 색인에서 출발하여 시소러스, 분류체계, 이미지 기술요소, 범주화 방식 등을 이용하는 방식으로 발전하여 왔다. 이 연구는 Panofsky의 이미지 정보 중 이차 이미지 정보의 색인(iconographical analysis of image information)에 있어 이용자들을 대상으로 하여 그 객관성을 측정하고, 색인의 객관성과 관련된 이미지 기술요소들을 밝혀내고자 하였다. 이미지 속의 인물이나 물체 등 사실적이고 정형화된 일차 이미지 정보와는 대조적으로, 보다 주관적이고 해석적인 이차 이미지 정보의 예로 감정정보를 택하여 48명의 이용자들을 대상으로 2차에 걸친 실험을 하였다. 1차 실험에서는 같은 이미지 안에서 각각의 이용자들이 읽어내는 감정정보의 일치도를 측정하였고 2차 실험에서는 이용자들이 이미지 탐색 과정 중 검색된 이미지에 부여된 색인어에 대한 동의 정도를 통하여 색인의 객관성을 측정하였다. 1차와 2차 실험 결과는 이용자들이 같은 이미지에 대하여 다양한 해석을 내리고 있으며 주관적인 해석이나 개인차가 이차 이미지 정보의 색인에 영향을 미치는 요소로 작용하고 있음을 보여 주었다. 이 연구의 결과는 이차 이미지 정보에 대한 이용자들의 주관적인 반응을 수렴할 수 있는 색인 시스템이나 탐색기법에 대한 계속적인 연구 및 개발의 필요성을 강조하고 있다.

Abstract

Developing good methods for image description and indexing is fundamental for successful image retrieval, regardless of the content of images. Researchers and practitioners in the field of image indexing have developed a variety of image indexing systems and methods with the consideration of information types delivered by images. Such efforts in developing image indexing systems and methods include Panofsky''''s levels of image indexing and indexing systems adopting different approaches such as thesauri-based approach, classification approach. description element-based approach, and categorization approach. This study investigated users'''' perception of the objectiveness of image indexing, especially the iconographical analysis of image information advocated by Panofsky. One of the best examples of subjectiveness and conditional-dependence of image information is emotion. As a result, this study dealt with visual emotional information. Experiments were conducted in two phases : one was to measure the degree of agreement or disagreement about the emotional content of pictures among forty-eight participants and the other was to examine the inter-rater consistency defined as the degree of users'''' agreement on indexing. The results showed that the experiment participants made fairly subjective interpretation when they were viewing pictures. It was also found that the subjective interpretation made by the participants resulted from the individual differences in terms of their educational or cultural background. The study results emphasize the importance of developing new ways of indexing and/or searching for images, which can alleviate the limitations of access to images due to the subjective interpretation made by different users.

139
안세진(김포시 행정과) ; 황현호(㈜악어디지털) ; 임진희(이화여자대학교 정책과학과) 2022, Vol.39, No.3, pp.165-193 https://doi.org/10.3743/KOSIM.2022.39.3.165
초록보기
초록

현대 업무환경 변화의 중심은 디지털 기술이라고 할 수 있다. 특히 업무관리시스템 및 문서생산시스템에서 생산한 기록으로 업무를 증명하는 일반적인 공공기관에서 기록관리체계는 업무환경 그 자체이기도 하다. 김포시는 제4차 산업혁명기술 시대에 선제적으로 대응하고 업무환경 혁신을 이루기 위해 한국지능정보사회진흥원(NIA)의 2021년 공공부문 클라우드 선도 프로젝트 사업에 지원하였고 선도 기관으로 확정되어 3억 3천의 지원을 받아 공공 클라우드 기반의 AI-OCR을 통한 기록물 검색 및 활용기능 강화 프로젝트를 진행하였다. 이를 통해 규격화된 색인 값에 의존한 검색과 이미지 열람에 그치던 비전자기록의 한계를 넘어 데이터화 하였고 AI-OCR이라는 신기술 적용으로 98%의 인식률을 구현하였다. 공공기관에 디지털 기술을 사용하여 업무 효율화, 생산성 향상, 개발비용 절감, 내․외부 이용자들의 기록관리 서비스 수준의 제고를 이루었기에 신기술과 기록물관리의 결합 사례연구를 통해 기록관리 분야 본연의 전문성을 높이는 방향과 업무환경 혁신 구현 사례를 공유하고자 한다.

Abstract

It can be said that digital technology is at the center of the change in the modern work environment. In particular, in general public institutions that prove their work with records produced by business management systems and document production systems, the record management system is also the work environment itself. Gimpo City applied for the 2021 public cloud leading project of the National Information Society Agency (NIA) to proactively respond to the 4th industrial revolution technology era and implemented a public cloud-based AI-OCR technology enhancement project with 330 million won in support of 330 million won. Through this, it was converted into data beyond the limitations of non-electronic records limited to search and image viewing that depend on standardized index values. In addition, a 98% recognition rate was realized by applying a new technology called AI-OCR. Since digital technology has been used to improve work efficiency, productivity, development cost, and record management service levels of internal and external users, we would like to share the direction of enhancing expertise in the record management and implementation of work environment innovation.

140
나경식(건국대학교) ; 이지수(숙명여자대학교) 2014, Vol.31, No.3, pp.271-291 https://doi.org/10.3743/KOSIM.2014.31.3.271
초록보기
초록

본 연구는 간호학과 학생들의 전자형태 문서의 이용 및 문서읽기 행태를 분석하기 위해 이들의 행태에서 나타나는 요소들에 대해 종합적으로 분석해 보고자 하였다. 이를 위해 본 연구는 간호학과 학생을 중심으로 지난 한 학기동안 학생들이 경험한 읽기행태를 조사하여 문서형태선호도와 요소 등을 다각적으로 분석하였다. 총 509명의 응답에 기초하여 분석한 결과, 간호학과 학생들은 일반적으로 전자형태문서에 대한 선호도가 높은 것으로 나타났으며, 소장하고 싶은 문서형태 또한 전자형태문서라고 응답하였다. 응답자 중, 약 94% 이상이 필요한 정보를 찾기 위해 30분 이상을 소요하고 있다고 나타났으며, 접근경로는 ‘네이버’ 검색엔진을 가장 많이 사용하는 것으로 응답하였다. 또한 주로 찾는 정보의 주제는 수업관련 정보가 가장 많았으며, 정보의 접근 장소로는 집에서 주로 정보를 찾고 이용하는 것으로 나타났다. 특히, 응답자들의 이동 중에 나타나는 문서선호도는 전자형태에 대한 선호도가 높게 나타났으며, 이동의 간편성과 접근의 용이성이 가장 높은 이유로 드러났다. 본 연구의 결과는 간호학과 학생들의 문서읽기행태를 분석하여 인쇄형태와 전자형태 문서의 읽기행태에 대한 이해를 증진시키고 향후 간호학 분야에서의 의학도서관 디지털정보이용의 서비스 설계 및 도구를 개발 또는 보완하기 위한 자료와, 더 나아가, 디지털 도서관 이용자 서비스 개선 방안을 모색하는 데 자료를 제시하고자 한다.

Abstract

The purpose of this study is to analyze undergraduate nursing students' electronic document use and reading behavior. To do this, a survey questionnaire was collected from 509 respondents who experienced reading behavior for the last semester. The results of this study show that nursing students’ preference of electronic documents is higher than that of printed documents in general. They also prefer electronic documents to printed documents when they want to keep documents. Of respondents, about 94% or higher spent 30mins or more to find information and the main source to find information is ‘Naver’ search engine as the highest information source, and the place to access information is ’Home’ as their highest information access location. In particular, the preference of the document ‘on the move’ is electronic documents and the main reason includes convenience and easiness to access and move the documents. The findings of this study expect to facilitate the understanding of undergraduate nursing students electronic document use and reading behavior so that it can be used to design and develop medical digital library services and tools more effectively and efficiently in medical area in the future. Furthermore, it expects to provide useful data in promoting user services in digital library in a whole.

정보관리학회지