바로가기메뉴

본문 바로가기 주메뉴 바로가기

logo

검색어: 정보검색, 검색결과: 162
초록보기
초록

디지털 도서관을 통해 제공되는 정보 자원의 형태와 종류가 다양화됨에 따라 자료의 유형별로 적정 수준의 메타데이터를 정의하고 제공하는 것이 또 다른 과제로 대두되고 있다. 일반 텍스트 자료와 달리 수치로 표현된 데이터에 대한 해석을 필요로 하는 통계 자료의 특성상, 통계 도메인에서 메타데이터는 통계 자료의 검색뿐 아니라 검색된 자료의 정확한 이해와 활용을 위한 필수적인 도구로 인식되고 있다. 하지만 기존의 통계 메타데이터 연구는 통계 작성 기관이나 분석 기관의 전문적인 요구에 중점을 두고 있어, 인터넷을 통해 통계 자료에 접근하는 일반 이용자들의 관점에서의 논의는 상대적으로 부족한 실정이다.일반 이용자를 위한 통계 메타데이터에 대한 논의의 단초로서, 본 연구는 미국의 연방 통계 기관인 the Bureau of Labor Statistics (BLS, HYPERLINK "http://www.bls.gov/" http://www.bls.gov/) 및 the Energy Information Administration (EIA, HYPERLINK "http://www.eia.doe.gov/" http://www.eia.doe.gov/)의 웹사이트에 대한 내용 분석을 통해, 현재 인터넷을 통해 통계 자료에 접근하는 이용자들에게 제공되고 있는 메타데이터의 현황을 평가하였다. 본 사례 연구의 결과는 이들 웹사이트를 통해 제공되는 방대한 양의 자료에도 불구하고 메타데이터의 제공 수준은 국제 기구에 의해 정의된 최소 수준에 미치지 못함을 나타내고 있어,이용자 중심의 메타데이터 설계의 필요성을 재확인 하고 있다.

Abstract

As increasingly diverse kinds of information materials are available on the Internet, it becomes a challenge to define an adequate level of metadata provision for each different type of material in the context of digital libraries. This study explores issues of metadata provision for a particular type of material, statistical tables. Statistical data always involves numbers and numeric values which should be interpreted with an understanding of underlying concepts and constructs. Because of the unique data characteristics, metadata in the statistical domain is essential not only for finding and discovering relevant data, but also for understanding and using the data found. However, in statistical metadata research, more emphasis has been put on the question of what metadata is necessary for processing the data and less on what metadata should be presented to users.In this study, a case study was conducted to gauge the status of metadata provision for statistical tables on the Internet. The websites of two federal statistical agencies in the United States were selected and a content analysis method was used for that purpose. The result showing insufficient and inconsistent provision of metadata demonstrate the need for more discussions on statistical metadata from the ordinary web users’ perspective.

152
최예진(이화여자대학교 문헌정보학과) ; 정연경(이화여자대학교) 2016, Vol.33, No.3, pp.63-83 https://doi.org/10.3743/KOSIM.2016.33.3.063
초록보기
초록

다양한 매체와 유형으로 생산되는 정보자원에 대한 이용이 높아짐에 따라, 정보자원을 기술하기 위한 정보조직의 도구로서 메타데이터에 대한 중요성이 높아지고 있다. 본 연구에서는 메타데이터 분야의 연구 영역을 파악할 수 있도록 동시출현단어 분석을 사용하여 메타데이터 분야의 지적 구조를 규명하고자 하였다. 이를 위하여 1998년 1월 1일부터 2016년 7월 8일까지 Web of Science 핵심컬렉션에 등재된 저널에 게재된 문헌을 대상으로 ‘metadata’라는 질의어로 Topic 검색을 수행하여, 총 727건의 논문에 대한 서지정보를 수집하였다. 이 중 저자 키워드를 가진 410건의 논문의 저자 키워드로 수집하고, 전처리 과정을 거쳐 저자 키워드 총 1,137개를 추출하여 최종적으로 빈도수 6회 이상의 키워드 37개를 분석대상으로 선정하였다. 이후 메타데이터 분야의 지적구조 규명을 위해 첫째, 네트워크 분석을 통하여 2개 영역 9개 군집을 도출하였으며, 메타데이터 분야 키워드들의 지적 관계를 시각화하고, 중심성 분석을 통한 전역 중심 키워드와 지역 중심이 높은 키워드를 제시하였다. 둘째, 군집분석을 실시하여 형성된 6개의 군집을 다차원축적지도상에 표시하였으며, 각 키워드들 간의 상관관계에 따른 지적구조를 제시하였다. 이러한 연구의 결과는 메타데이터 분야의 지적구조를 시각적으로 파악할 수 있게 하며, 향후 메타데이터 관련 교육과 연구의 방향성 모색에 유용하게 사용될 수 있을 것이다.

Abstract

As the usage of information resources produced in various media and forms has been increased, the importance of metadata as a tool of information organization to describe the information resources becomes increasingly crucial. The purposes of this study are to analyze and to demonstrate the intellectual structure in the field of metadata through co-word analysis. The data set was collected from the journals which were registered in the Core collection of Web of Science citation database during the period from January 1, 1998 to July 8, 2016. Among them, the bibliographic data from 727 journals was collected using Topic category search with the query word ‘metadata’. From 727 journal articles, 410 journals with author keywords were selected and after data preprocessing, 1,137 author keywords were extracted. Finally, a total of 37 final keywords which had more than 6 frequency were selected for analysis. In order to demonstrate the intellectual structure of metadata field, network analysis was conducted. As a result, 2 domains and 9 clusters were derived, and intellectual relations among keywords from metadata field were visualized, and proposed keywords with high global centrality and local centrality. Six clusters from cluster analysis were shown in the map of multidimensional scaling, and the knowledge structure was proposed based on the correlations among each keywords. The results of this study are expected to help to understand the intellectual structure of metadata field through visualization and to guide directions in new approaches of metadata related studies.

초록보기
초록

학술 문헌 원문에서 발견되는 인용문은 인용에 기초한 학술문헌 자동 요약, 리뷰 논문 자동 생성, 인용문 감성 분석, 인용문 기반 문헌 검색 등 다양한 학술 정보 서비스의 창출을 가능케 한다. 이러한 서비스가 가능하기 위해서는 원문 텍스트로부터 인용문의 자동 인식이 선행되어야 한다. 그러나 인용문의 인식은 인용 표지가 부착되지 않은 암묵 인용문의 존재로 인해 그 처리가 용이하지 않다. 영어의 경우 최근 이에 대한 연구가 집중되고 있으나 한국어 학술 문헌 내 인용문의 자동 인식 연구는 찾기 힘들다. 이 논문은 한국어 인용문을 자동 인식하는 규칙 기반의 방법을 제시하고 다양한 베이스라인 기법들과 인용문 인식 성능을 비교하였다. 제안된 방법은 테스트 셋 내 전체 암묵 인용문의 30%를 약 70%의 정확률로 인식할 수 있었다.

Abstract

Identifying citing sentences from article full-text is a prerequisite for creating a variety of future academic information services such as citation-based automatic summarization, automatic generation of review articles, sentiment analysis of citing statements, information retrieval based on citation contexts, etc. However, finding citing sentences is not easy due to the existence of implicit citing sentences which do not have explicit citation markers. While several methods have been proposed to attack this problem for English, it is difficult to find such automatic methods for Korean academic literature. This article presents a rule-based approach to identifying Korean citing sentences. Experiments show that the proposed method could find 30% of implicit citing sentences in our test data in nearly 70% precision.

초록보기
초록

공공데이터의 개방과 제공의 활성화와 함께, 공공도서관이 업무 중에 생산한 서지 데이터와 대출 이력과 같은 데이터가 도서관 공공데이터로 제공되고 있다. 본 논문은 도서관 공공데이터의 품질을 진단하고, 그 결과를 바탕으로 도서관 공공데이터의 품질을 높일 개선방안을 제안하고자 한다. 먼저, 문헌정보학 영역에서 공공데이터에 관해 이루어진 연구를 개괄한다. 그다음으로, 도서관 공공데이터 개방 플랫폼인 도서관 정보나루의 오픈 API를 통해 확보한 도서관 공공데이터의 완전성과 정확성을 진단한다. 마지막으로, 데이터 품질 진단 결과에 바탕을 개선방안을 도출한다. 완전성을 진단한 결과, 도서의 식별과 검색을 위 필수적인 서지 요소에서 다수의 공백이 확인되었다. 정확성을 진단한 결과, 값의 유형, 값의 범위, 제한조건을 따르지 않는 부정확한 서지 요소가 확인되었다. 본 연구는 데이터 품질 진단 분석 결과를 바탕으로, 도서관 정보나루의 데이터 수집 절차 개선, 데이터별 스키마 구축, 데이터 수집과 데이터 처리에 관한 안내 제공, 원자료 공개를 제언하였다.

Abstract

With the popularization of open government data, Library-related open government data is also open and utilized to the public. The purpose of this paper is to diagnose the quality of library-related open government data and propose improvement measures to enhance the quality based on the diagnosis result. As a result of diagnosing the completeness of the data, a number of blanks are identified in the bibliographic elements essential for identifying and searching a book. As a result of diagnosing the accuracy of the data, the bibliographic elements that are not compliant with the data schema have been identified. Based on the result of data quality diagnosis, this study suggested improving the data collection procedure, establishing data set schema, providing details on data collection and data processing, and publishing raw data.

155
이경화(건국대학교 일반대학원 문헌정보학과) ; 노영희(건국대학교 문헌정보학과) 2022, Vol.39, No.1, pp.17-44 https://doi.org/10.3743/KOSIM.2022.39.1.017
초록보기
초록

본 연구는 대학도서관 이용자의 도서관 불안 요인을 분석하여 비대면 서비스가 도서관 불안해소에 미치는 영향에 관한 방안 제시를 목적으로 하였다. 이를 위해 코로나19 사태에 따른 대학도서관의 이용자 서비스 대응 활동 사례를 살펴보고, 재학생 5,000명 이상 10,000명 이하의 국내 4년제 대학도서관에서 재학생 1인당 도서관 방문자수가 가장 높은 순위부터 40교를 선정하여 비대면 방식의 정보 서비스 및 프로그램 사례를 분석하였고, K대학도서관을 이용하는 재학생을 대상으로 K-LAS를 재구성하여 설문조사를 실시하였다. 수집된 데이터를 대상으로 빈도분석, 기술통계분석, 탐색적 요인분석, 신뢰도분석, 상관관계분석, 다중회귀분석을 적용하여 이용자의 도서관 불안 요인을 분석하였다. 도서관의 물리적․환경적 요인, 자료검색선정 요인, 디지털 정보시스템 요인, 사서(직원) 요인, 심리․정서적 요인등 5가지 도서관 불안 요인과 비대면 서비스 활성화 요인간 관계를 파악하고, 비대면 서비스 활성화 요인이 도서관 불안요인에 미치는 영향을 살펴보았으며, 그 결과, 비대면 서비스 활성화 요인들이 도서관 디지털 정보시스템 불안 요인에 가장 크게 영형을 끼치는 것으로 나타났다. 분석결과에 기초하여 비대면 서비스 활성화를 통하여 이용자의 도서관 불안해소 방안을 도출해보고자 하였다.

Abstract

The purpose of this study was to present a plan on the effect of non-face-to-face services on library anxiety facilities by analyzing the library anxiety factors of university library users. To this end, we look at the cases of university library user service response activities in response to the COVID-19 crisis and select 40 schools with the highest number of library visitors per student from among domestic four-year university libraries with 5,000 or more and less than 10,000 students. Methods of information service and program cases were analyzed, and K-LAS was reconstructed and surveyed for current students using the K university library, and frequency analysis, descriptive statistical analysis, exploratory factor analysis, and reliability analysis, correlation analysis, and multiple regression analysis were applied to analyze the library anxiety factors of users. Identify the relationship between 5 library anxiety factors and non-face-to-face service activation factors, such as physical/environmental factors of the library, data search selection factors, digital information system factors, librarian (staff) factors, and psychological/emotional factors, and activate non-face-to-face services. The influence of these factors on library anxiety factors was examined, and as a result, it was found that non-face-to-face service activation factors had the greatest influence on library digital information system anxiety factors. Based on the analysis results, it was attempted to derive a plan to relieve users’ library anxiety by activating non-face-to-face services.

156
서은경(한성대학교) ; 성혜은(한성대학교) 2007, Vol.24, No.2, pp.71-87 https://doi.org/10.3743/KOSIM.2007.24.2.071
초록보기
초록

인터넷 환경과 디지털자원의 활용환경이 빠르게 변화됨에 따라 탐색과 브라우징을 제공해주는 정보시스템의 인터페이스 또한 새롭게 변해가고 있다. 특히 최근에 검색 인터페이스에서 많이 사용되고 있는 긴 리스트의 메뉴항목을 이용자가 보다 쉽게 브라우징하고 선택할 수 있도록 하기 위하여 시각화기법을 이용하여 디스플레이하고 있다. 본 연구는 이용자와 데이터 특성에 맞는 긴 메뉴항목 시각화 기법을 제안하기 위하여 긴 리스트의 메뉴항목을 시각화하기 위하여 많이 사용되고 있는 기법 즉 트리구조 메뉴, 목차방식 메뉴, 롤-오버방식 메뉴, 클릭방식 메뉴, 어안렌즈방식 메뉴를 비교하였다 그 결과 계층구조 메뉴 중에서는 전문가는 목차방식 메뉴를, 초보자는 트리구조 메뉴를 선호하고, 또 순차적 구조 메뉴 중에서는 전문가와 초보자 모두 롤-오보방식 메뉴를 선호하고 있음을 알 수 있었다.

Abstract

With the rapid change of the Web and E-transaction application, the search interface is providing more powerful search and visualization methods, while offering smoother integration of technology with task. Especially, visualization techniques for long menu-lists are applied in retrieval system with the goal of improving performance in users ability to select one item from a long list. In order to review visualization techniques appropriate to the types of users and data set, this study compared the five visualization browsers such as the Tree-structured menu, the Table-of-contents menu, the Roll-over menu, the Click menu, and Fisheye menu. The result of general analyses shows that among the hierarchical methods, the experienced group prefers the Table-of-contents method menu, whereas the novices group prefers the Tree-structure method menu. Among the linear methods, the two groups prefer the Roll-over menu. The Roll-over menu is most preferred among the five browsers by the two groups.

초록보기
초록

본 연구는 기존의 도서관정보시스템에서 기록물을 검색, 이용할 수 있도록 기록물용 KORMARC 데이터필드 개발을 위한 메타데이터 요소를 설정하였다. 본 연구의 결과를 요약하면 다음과 같다.첫째, 본 연구에서는 ISAD(G)2에서 제시하고 있는 7개 영역 외에 보존영역(conservation area) 과 물리적 기술영역(physical description area)을 추가하였다. 그리고 ISAD(G)2는 26가지 요소만을 제시하 고 있어 상세수준의 기술요소를 필요로 하는 기관에서는 불충분하다는 선행연구에서 제시된 문제점을 보완하기 위해 분석결과를 토대로 영역별 하위요소를 종합하여 선정하였다.둘째, 우리나라 기록물의 특수성을 기술요소에 반영하기 위해 사무관리규정시행규칙과 전자정부 구현을 위한 행정업무 등의 전자화 촉진에 관한 법률에서 제시하고 있는 종이 공문서 및 전자문서 서식의 분석을 통해 선정한 기록물 기술요소를 추가하였다. 또한 공공기관의 기록물 관리에 관한 법률 시행령에서 규정하고 있는 공개여부 및 등급, 공개 일자, 공개범위, 보존기간, 보존등급, 보존가치, 기록물의 상태기술 요소를 추가하였다.셋째, 기록물 관리를 위해 512 생산일자 관련주기(creation dates note)와 5 검색보조도구주 기(finding aids note), 583 작업현황 주기(action note), 584 245 표제저자사항(title statement), 30 물리적 기술(physical description), 306 재생/연 주시간(playing time), 506 접근제한주기(restriction on acces note), 534 원본주기(original version note), 535 원본/사본의 소장처주기(location of originals/duplicates note), 540 이용과 복제제한에 관한 주기(terms governing use and reproduction notes), 541 직접적 graphical or historical note), 581 출판주기(publication note), 850 소장처(holding institution) 데이터필드의 식별기호를 재구성, 추가하였다.

Abstract

The study intended to develop KORMARC for archives in order to integrate archives with library materials. The results of the study can be sumarized as folows; (1) 2 areas for conservation and physical description are aded study has also proved that the existing 26 elements of ISAD(G)2 are not fuly enough to satisfy the information demands of institutions and its users as wel. (2) For the use of domestic archives in particular, the study h as added the description elements of archives that apeared in the Government Regulations of Ofice Managemen t and those forms of documents that are specified by law for the sake of computerization. The study has aded the possible release and grade, release dates, release range, conservation periods, conservation grade, conservation value, the status description of archives elements that are specified in Public Record Management Law.(3) The study has developed the following data fields to be add ed into KORMARC. and 584 accumulation note. Also it reorganizes and adds the indicators of the 245 title statement, 300 physica l description, 306 playing time, 506 restriction on access note, 534 original version note, 535 location of orig inals/duplicates note, 540 terms governing use and reproduction notes, 541 imediate source of acquisition not publication note, 850 holding institution data fields.

초록보기
초록

주제명은 이용자가 어린이 그림책을 효과적으로 접근하도록 지원한다. 그러나 어린이 그림책은 다른 자료에 비해 표제나 목차와 같이 자료 자체에서 주제명을 선정하기가 어렵다. 또한 텍스트 외에 그림이 주는 정보량이 큰 편이다. 따라서 그림책의 주제접근을 위해서는 별도의 주제명 목록을 작성할 필요가 있다. 그런데 어린이 그림책에 일반 도서용으로 개발된 주제명을 그대로 사용하기는 적절하지 않을 수 있다. 주제명의 유형과 수준이 상이할 수 있기 때문이다. 이에 본 연구에서는 어린이 그림책에 적합한 주제명표를 개발하고자 하였다. 기본 주제명의 선정을 위해서는 영미권에서 발행된 그림책 주제명표를 참고하였는데, 이 과정에서 우리 문화와 언어에 맞도록 기존의 표목을 수정․추가하였다. 또한 그림책의 주요 독자층인 어린이에게 적합한 표목을 선정하기 위해 초등국어사전과 같은 참고자료도 활용하였다. 그리고 시범적으로 구축된 주제명표를 어린이 그림책을 대상으로 한 권장도서 목록에 적용하여, 주제검색이나 브라우징, 도서 추천 등에 활용하는 방안을 제시하였다.

Abstract

Subject headings support the effective access of children's picture books. However, it is difficult to select subject terms from titles or table of contents in children's picture books because of their relatively little textual information. Therefore, it is necessary to assign subject terms to each picture book. However, it is not adequate to use general subject headings because the types and levels of general subject headings are different from special subject headings for the children's materials. For this reason, this study aims to develop subject headings for children's picture books. The subject terms in A to Zoo were selected, and the selected terms were translated into Korean and modified for the Korean culture and language. Other reference books, such as Elementary Korean Dictionary, were also used to determine adequate terms for children. The resulting subject headings were assigned to the recommended picture books for children and used to search by subject, browse, and recommend books.

초록보기
초록

본 연구의 목적은 1) 소설 속 지명 데이터베이스(DB)를 구축하고, 2) 확장 가능한 지명 DB를 위해 자동으로 지명을 추출하여 데이터베이스를 갱신하며, 3) 데이터베이스 내의 소설지명과 용례를 검색하고 시각화하는 파일럿시스템을 구현하는 데 있다. 특히, 학습자료(training)에 해당하는 말뭉치(corpus)를 확보하기 어려운, 소설지명과 같이 현재 잘 쓰이지 않는 개체명을 자동으로 추출하는 것은 매우 어려운 문제이다. 효과적인 지명 정보 추출용 학습자료 말뭉치 확보 문제를 해결하기 위해 본 논문에서는 이미 수작업으로 구축된 웹 지식(어휘사전)을 활용하여 학습에 필요한 충분한 양의 학습말뭉치를 확보하는 방안을 적용하였다. 이렇게 확보된 학습용 코퍼스와 학습된 자동추출 모듈을 가지고, 새로운 지명 용례를 찾아 추가하는 지명 데이터베이스 확장 도구를 만들었으며, 소설지명을 지도 위에 시각화하는 시스템을 설계하였다. 또한, 시범시스템을 구현함으로써 실험적으로 그 타당성을 입증하였다. 끝으로, 현재 시스템의 보완점을 제시하였다.

Abstract

This study aimed to design a semi-automatic web-based pilot system 1) to build a Korean novel geo-name, 2) to update the database using automatic geo-name extraction for a scalable database, and 3) to retrieve/visualize the usage of an old geo-name on the map. In particular, the problem of extracting novel geo-names, which are currently obsolete, is difficult to solve because obtaining a corpus used for training dataset is burden. To build a corpus for training data, an admin tool, HTML crawler and parser in Python, crawled geo-names and usages from a vocabulary dictionary for Korean New Novel enough to train a named entity tagger for extracting even novel geo-names not shown up in a training corpus. By means of a training corpus and an automatic extraction tool, the geo-name database was made scalable. In addition, the system can visualize the geo-name on the map. The work of study also designed, implemented the prototype and empirically verified the validity of the pilot system. Lastly, items to be improved have also been addressed.

160
이재윤(명지대학교 문헌정보학과) 2023, Vol.40, No.4, pp.403-428 https://doi.org/10.3743/KOSIM.2023.40.4.403
초록보기
초록

이 연구에서는 데이터 리터러시 분야 연구의 발전 경로와 지적구조 및 떠오르는 유망 주제를 파악하고자 하였다. 이를 위해서 Web of Science에서 검색한 데이터 리터러시 관련 논문은 교육학 분야와 문헌정보학 분야 논문이 전체의 60% 가까이를 차지하였다. 우선 인용 네트워크 분석에서는 페이지랭크 알고리즘을 사용해서 인용 영향력이 높은 다양한 주제의 핵심 논문을 파악하였다. 데이터 리터러시 연구의 발전 경로를 파악하기 위해서 기존의 주경로분석법을 적용해보았으나 교육학 분야의 연구 논문만 포함되는 한계가 있었다. 이를 극복할 수 있는 새로운 기법으로 페이지랭크 주경로분석법을 개발한 결과, 교육학 분야와 문헌정보학 분야의 핵심 논문이 모두 포함되는 발전 경로를 파악할 수 있었다. 데이터 리터러시 연구의 지적구조를 분석하기 위해서 키워드 서지결합 분석을 시행하였다. 도출된 키워드 서지결합 네트워크의 세부 구조와 군집 파악을 위해서 병렬최근접이웃클러스터링 알고리즘을 적용한 결과 대군집 2개와 그에 속한 소군집 7개를 파악할 수 있었다. 부상하는 유망 주제를 도출하기 위해서 각 키워드와 군집의 성장지수와 평균출판년도를 측정하였다. 분석 결과 팬데믹 상황과 AI 챗봇의 부상이라는 시대적 배경 하에서 사회정의를 위한 비판적 데이터 리터러시가 고등교육 측면에서 급부상하고 있는 것으로 나타났다. 또한 이 연구에서 연구의 발전경로를 파악하는 수단으로 새롭게 개발한 페이지랭크 주경로분석 기법은 서로 다른 영역에서 병렬적으로 발전하는 둘 이상의 연구흐름을 발견하기에 효과적이었다.

Abstract

This study investigates the development path and intellectual structure of data literacy research, aiming to identify emerging topics in the field. A comprehensive search for data literacy-related articles on the Web of Science reveals that the field is primarily concentrated in Education & Educational Research and Information Science & Library Science, accounting for nearly 60% of the total. Citation network analysis, employing the PageRank algorithm, identifies key papers with high citation impact across various topics. To accurately trace the development path of data literacy research, an enhanced PageRank main path algorithm is developed, which overcomes the limitations of existing methods confined to the Education & Educational Research field. Keyword bibliographic coupling analysis is employed to unravel the intellectual structure of data literacy research. Utilizing the PNNC algorithm, the detailed structure and clusters of the derived keyword bibliographic coupling network are revealed, including two large clusters, one with two smaller clusters and the other with five smaller clusters. The growth index and mean publishing year of each keyword and cluster are measured to pinpoint emerging topics. The analysis highlights the emergence of critical data literacy for social justice in higher education amidst the ongoing pandemic and the rise of AI chatbots. The enhanced PageRank main path algorithm, developed in this study, demonstrates its effectiveness in identifying parallel research streams developing across different fields.

정보관리학회지