이 연구는 디지털화 과정을 통해 생산되는 디지털화 기록의 체계적 관리와 품질 유지를 위해 필요한 메타데이터 요소(안)을 제안하는데 목적을 두고 있다. 메타데이터 요소(안)의 개발에 앞서 이 연구에서는 디지털화 기록의 정의와 특성을 확인하고, 원천 기록의 사본이자 대체물로서 디지털화 기록을 규정하여 원천 기록과의 관계를 정립하였다. 다음으로, 국내 기록관리 메타데이터 표준과 미국 및 영국의 사례를 분석하여 디지털화 기록에 대한 메타데이터 요소 비교 및 요소 설계시 고려할 사항을 도출하였다. 이러한 분석결과를 토대로 하여, 디지털화 기록 관리를 위한 메타데이터의 설계방향은 첫째, 원천 기록과 디지털화 기록의 관계 정립, 둘째, 자원 유형별 특성에 따른 자동추출 메타데이터 요소 확대, 셋째, 업무과정 및 프로젝트에 대한 메타데이터 작성 등 3가지로 정리되었다. 이에 근거하여 디지털화 기록의 메타데이터를 디지털화 기록 메타데이터과 디지털화 프로세스 메타데이터로 개체를 구분하고, 해외 사례를 참조하여 각 개체별로 추가되어야 할 요소를 제안하였다.
This study aims to design the metadata elements for managing and maintaining digitized records resulting from digitization. The digitized records were first defined and characterized, then assigned as copies and surrogates for source records. Next, the factors to be considered when designing metadata elements for digitized records were determined by comparing standards from different countries like the United States and the United Kingdom. As a result of the comparison, establishing a relationship between digitized records and source records, expanding the automatically extracted metadata elements following resource characteristics, and creating metadata for digitization processes and projects were set to be the key tasks of metadata design for managing digitized records. Furthermore, the metadata elements for digital records and digitization processes were designed individually, and the elements to be added for each entity were proposed by referring to standards from other counties.
기록을 관리하는 궁극적인 목적은 안전한 보존과 효율적 활용이다. 그러나 공공기록물 관리의 수장인 국가기록원의 검색서비스인 국가기록포털은 검색 시스템이 도입된 지 10년이 넘어 노후화되었고, 검색도구도 이원화되어 있다. 또한, 국가기록물을 열람하고자 하는 이용자의 검색 만족도를 충족시키지 못해 개선이 필요하다. 본 연구는 국가기록물 검색 고도화를 위한 사전 연구로, 현재의 국가기록원 검색시스템의 검색 품질 현황을 파악하는 것을 목적으로 한다. 이를 위해 국가기록원에서 사용 중인 검색도구인 CAMS와 국가기록포털의 현황을 분석하고 검색서비스 품질을 점검하기 위한 평가셋을 구축, 이용자 관점에서 국가기록포털의 검색 품질 평가를 실시하였다. 국가기록포털의 성능평가를 위한 척도로는 정확률과 재현율, F-score, MRR 등을 활용, 다양한 각도에서 분석하였다. 검색 품질 평가결과 전반적으로 검색 성능이 낮은 것으로 나타났으며, 특히 ‘주제별상세검색’의 경우 정확률, 재현율, MRR이 모두 낮게 나와 개선이 시급할 것으로 보인다. 본 연구를 통해 구축된 평가셋이 향후 국가기록원 검색시스템의 고도화 이후 시스템의 성능이 얼마나 개선되었는지를 객관적으로 측정할 수 있는 기틀로 활용되기를 기대한다.
The ultimate record management’s purpose is preservation and utilization. However, the National Archives of Korea (NAK)s Portal has problems such as search system aging and search tools dualization. As a result, the users’ search satisfaction is not satisfied, and the improvement demand increases. This study aimed to evaluate the NAK’s search quality as a preliminary study for NAK search system advancement. To this end, we analyzed the current status of CAMS and NAK’s Portal. Then, we established the test sets and evaluated the NAK’s Portal quality from the user’s point of view. Evaluation results were analyzed using Precision, Recall, F-score, and MRR. The analysis results showed that the overall search performance was low, particularly in the “advanced subject search,” which showed low performance in Precision, Recall, and MRR. Thus, improvement is urgently needed. The test sets established for this study are expected to be used as a basis for objectively measuring the improvement of the search performance after the NAK search system advancement.
공공기관의 유튜브 동영상은 디지털 공공기록물로서 관리 및 보존이 필요하다. 이때 동영상 자체와 동영상을 설명하는 메타데이터도 함께 보존해야한다. 본 연구의 목적은 공공기관이 유튜브에 발행한 동영상을 아카이빙할 때 필요한 핵심 메타데이터 요소를 선정하는 것이다. 이를 위해 NAK 8, PREMIS, ISAD(G), 유튜브 메타데이터를 참조하여 설명, 구조, 관리, 보존, 이용자 참여의 5개 상위 영역, 10개 하위 영역의 메타데이터 요소를 설계하였다. 이후 14명의 전문가를 대상으로 설계한 메타데이터 요소를 검증하였다. 마지막으로 평가 결과에 대한 타당도 검증과 신뢰도 검증을 진행하였다. 타당도와 신뢰도 검증의 기준값을 모두 만족하는 요소는 63개 측정 요소 중 33개 요소로 확인되었다. 해당 요소들을 공공기관 유튜브 동영상 아카이빙을 위한 메타데이터 핵심 요소로 선정하였다.
YouTube videos of public institutions are digital public records that need to be managed and preserved. As such, the video and the metadata describing the video should also be preserved. This study aims to select the key metadata elements necessary for archiving videos published on YouTube by public institutions. To this end, five high-level areas, namely the description, structure, management, preservation, and user participation, and the metadata elements of 10 subareas, were designed by referring to NAK 8, PREMIS, ISAD(G), and YouTube metadata. Afterward, the metadata elements designed by 14 experts were verified. Lastly, the validity and reliability of the evaluation results were verified. Of the 63 elements, 33 satisfied the validity and reliability criteria. Thus, these elements were selected as the core metadata for archiving YouTube videos in public institutions.
본 연구는 해방촌 니트 사업을 주제로 수집된 구술 기록의 주제 접근을 위해 패싯을 기반으로 한 주제명표목의 개발 방안을 제안하는데 목적이 있다. 첫째, 문헌 연구에서 구술 기록과 그 내용의 개념과 특징을 고찰하고 구술 내용에 대한 패싯과 주제명표목의 적용 의미를 살펴보았다. 둘째, 구술의 서사적 측면을 반영한 육하원칙을 토대로 구술 기록에 대한 기본 패싯을 설정하였다. 셋째, 해방촌 니트 사업의 종사자와 관계자 7인과 면담자 1인의 구술 면담을 통해 수집된 녹취록을 대상으로 용어 분석을 진행하였고, 그 결과 540개의 주제어를 선정하고 패싯에 따라 범주화하였다. 마지막으로 패싯으로 구분한 주제어를 주제명표목의 표목으로 활용하여 관계어와 함께 작성하였다. 본 연구는 구술 기록의 내용에 대한 주제적 접근과 활용에 기여할 수 있을 것이다.
This study develops a methodology for facet-based subject headings for the subject access to oral history records collected by such a project of the knit business in Haebangchon. First, the concept and characteristics of oral history records and their contents were investigated, and the meaning of facets and subject headings applied to such content was examined in the literature review. Second, the basic facets of oral history records were created based on 5W1H that reflected the narrative feature of oral history. Third, 540 subject-related terms were selected through an analysis of the transcript written based on oral history interviews with one interviewer and seven interviewees linked to the knit business in Haebangchon. Fourth and last, subject headings were proposed with the selected subject-related terms categorized in facets with various relationships. These facet-based subject headings will improve the subject access and use of oral history records.
본 연구의 목적은 기록정보서비스의 의미와 범주에 대해 고찰하고, 이를 기반으로 기록정보서비스의 연구 성과를 분석함에 있다. 이를 위해 기록정보서비스의 정의, 유형, 대상을 검토하여 기록정보서비스의 연구 범위를 설정하고, 이에 따라 183편의 국내 학술논문을 수집하여 내용분석을 시도하였다. 내용분석은 2단계로 나누어 실시하였는데, 양적 지표를 기준으로 한 전반적인 연구추이 분석과 더불어 노드엑셀을 활용하여 확대된 내용분석인 언어 네트워크 분석을 시도하였다. 이러한 분석 결과를 토대로, 본 연구에서는 기존의 기록정보서비스 연구가 2006년 이후 본격적으로 시작되었으며 점차 이용자 중심의 기록정보서비스 패러다임이 적용되고 있음을 밝혀내었다. 그러나 논의의 대상과 연구방법, 게재 학회지 등이 편중되어 있는 한계 또한 확인하였고, 향후 논의의 지평을 확대할 필요가 있음을 제안하였다.
This study aims to examine the meaning and category of archival information services and analyze its research results. To this end, the research scope of the archival information service was set by reviewing the definition, types, and subjects. A total of 183 journal articles were gathered, and content analysis was conducted in two stages. In addition to the overall research trend analysis based on quantitative indicators, an expanded content analysis and language network analysis were attempted using Node Excel. This study revealed that the archival information service research began in earnest after 2006 and that the user-centered paradigm is gradually being applied. However, limitations confirmed that the subject of discussion, research methods, and journals were biased, and expanding the horizon of future discussion was suggested.
신행정수도건설 사업은 국가의 행정수도 이전을 목적으로 이행되는 중요한 국정사업으로서 건설 과정에서 생산되는 기록물은 역사적인 가치가 매우 높다. 그러나 우리나라는 이러한 신행정수도건설 관련 기록물의 관리가 미흡하기 때문에 관리 방안을 모색하는 것이 필요하다. 브라질은 신행정수도인 브라질리아 건설을 수행하며 생산된 기록물을 공공과 민간영역을 포함하여 수집하고 구축하여 서비스하고 있는 국가이다. ArPDF는 브라질리아 건설기록물을 관리하기 위하여 설립된 브라질의 기록물관리기관으로서 본 연구의 사례 분석 대상으로 선정하였다. 본 연구는 ArPDF의 웹 사이트와 공식출판물 등을 분석하여 신행정수도건설기록물 관리에 관한 전반적인 사항을 조사하고, 이를 바탕으로 우리나라의 신행정수도건설기록물 관리에 적용할 수 있는 시사점을 도출하였다.
The new administrative capital construction project is an important national project implemented to relocate the national administrative capital, and the records produced during the construction have high historical value. However, Korea’s management of these records related to the construction of the new administrative capital is insufficient; thus, finding a management plan is necessary. In contrast, Brazil is a country that collects, builds, and maintains both public and private records produced during the construction of Brasilia, the new administrative capital. Thus, Arquivo Público do Distrito Federal (ArPDF), the Brazilian records management organization established to manage Brasilia’s construction records, was selected as the case analysis subject in this study. By analyzing ArPDF’s website and official publications, this study investigated the overall matters related to the management of new administrative capital construction records and derived implications applicable to the management of new administrative capital construction records in Korea.
기록물은 과거와 현재를 포함하는 시간적 특성, 특정 언어에 제한되지 않는 언어적 특성, 기록물이 갖고 있는 다양한 유형을 복합적으로 갖고 있다. 기록물의 생성, 보존, 활용에 이르는 생애주기에서 텍스트, 영상, 음성으로 구성된 데이터의 처리는 많은 노력과 비용을 수반한다. 기계번역, 문서요약, 개체명 인식, 이미지 인식 등 자연어 처리 분야의 주요 기술은 전자기록과 아날로그 형태의 디지털화에 광범위하게 적용할 수 있다. 특히, 딥러닝 기술이 적용된 한국어 자연어 처리 분야는 다양한 형식의 기록물을 인식하고, 기록관리 메타데이터를 생성하는데 효과적이다. 본 논문은 한국어 자연어 처리를 기술을 소개하고, 기록 관리 분야에서 자연어 처리 기술을 적용하기 위한 고려사항을 논의한다. 기계번역, 광학문자인식과 같은 자연어 처리 기술이 기록물의 디지털 변환에 적용되는 과정은 파이썬 환경에서 구현한 사례로 소개한다. 한편, 자연어 처리 기술의 활용을 위해 기록관리 분야에서 자연어 처리 기술을 적용하기 위한 환경적 요소와 기록물의 디지털화 지침을 개선하기 위한 방안을 제안한다.
Records have temporal characteristics, including the past and present; linguistic characteristics not limited to a specific language; and various types categorized in a complex way. Processing records such as text, video, and audio in the life cycle of records’ creation, preservation, and utilization entails exhaustive effort and cost. Primary natural language processing (NLP) technologies, such as machine translation, document summarization, named-entity recognition, and image recognition, can be widely applied to electronic records and analog digitization. In particular, Korean deep learning–based NLP technologies effectively recognize various record types and generate record management metadata. This paper provides an overview of Korean NLP technologies and discusses considerations for applying NLP technology in records management. The process of using NLP technologies, such as machine translation and optical character recognition for digital conversion of records, is introduced as an example implemented in the Python environment. In contrast, a plan to improve environmental factors and record digitization guidelines for applying NLP technology in the records management field is proposed for utilizing NLP technology.
기록 기술은 기록의 검색과 이용에 필수적인 도구로써 기록의 활용에 있어 핵심적이다. 콘텐츠 서비스는 기록의 활용과 콘텐츠의 중요성이 강조되는 현대 사회에서 핵심적인 서비스다. 이 연구에서는 기록 기술과 콘텐츠 서비스를 다른 영역으로 볼 것이 아니라 상호보완적으로 발전할 수 있는 관계로 보았다. 기록 기술이 풍부하게 갖추어져 있으면 이를 기반으로 양질의 콘텐츠를 제작할 수 있고, 이렇게 만든 콘텐츠를 다시 기록 기술과 연계하여 기록 기술을 더욱 풍부하게 만들 수 있다. 이 연구에서는 기록 기술과 콘텐츠 서비스의 상호보완적 관계 밝히고, 이를 기반으로 한 고도화 방안을 제안하고자 한다. 이를 위해 국가기록원과 대통령기록관 웹사이트의 기록 기술 및 콘텐츠 서비스 현황과 문제점을 분석했고, 이와 비교할 모범사례로 영국의 TNA와 미국의 NARA, 서울기록원과 민주화운동기념사업회 오픈아카이브를 선정하였다. 6개의 기관을 분석한 시사점을 바탕으로 기록 기술과 콘텐츠 서비스 각각의 고도화방안과 상호보완적 발전방안을 함께 제안하였다. 이 연구를 통해 기록 기술과 콘텐츠 서비스가 상호보완적 방향으로 발전하길 기대해본다.
Archival descriptions are significant in utilizing archives, as they are important tools for archival research and use. Meanwhile, content services are key services in modern society, where the use of archives and the importance of content are increasing. In this study, archival descriptions and content services were not viewed as different areas but as a relationship that could advance complementarily. This is because if archival descriptions are rich and well-prepared, high-quality content can be produced based on them, and archival descriptions can be enriched if well-made content is supplemented or linked to the descriptions again. This study intends to reveal the complementary relationship between archival descriptions and content services and propose an advancement plan based on this relationship. As such, the current status and problems of the archival descriptions and content services of the National Archives of Korea and the Presidential Archives website were analyzed, and the UK's National Archives (TNA), the USA's National Archives and Records Administration (NARA), the Seoul Metropolitan Archives, and the Korea Democracy Foundation's Open Archives were selected as exemplary cases for comparison. Based on the implications of the six analyzed institutions, an advancement plan for archival descriptions and content services, as well as a complementary development plan, was proposed. Through this study, it is expected that archival descriptions and content services will develop in a mutually complementary direction.
본 연구는 연구자가 부여한 논문의 키워드 분석을 통해 기록보존 분야의 연구동향을 밝히고 시간의 경과에 따른 기록보존 분야 연구 주제의 변천과정을 파악하고자 하였다. 2000년부터 2021년까지 국내 학술지에 게재된 기록보존 연구 463편을 중심으로 NetMiner V.4를 통해 연결 중심성 분석과 매개 중심성 분석을 수행하였다. 수집한 연구논문을 학술지 게재 시기에 따라 제1구간(2000년~2007년), 제2구간(2008년~2014년), 제3구간(2015년~2021년)으로 나누어 분석하였다. 분석결과 전 구간에서는 ‘전자기록’과 ‘장기보존’, 제1구간에서는 ‘OAIS참조모형’, 제2구간에서는 ‘전자기록’, 제3구간에서는 ‘기록관리기준표’과 ‘장기보존’이 핵심 주제 키워드로 영향력과 확장성이 높은 것으로 나타났다. 제1구간에서 ‘디지털 보존’, ‘디지털화’, ‘OAIS참조모형’ 등 기록보존을 위한 개념적 틀과 이론 중심 연구, 제2구간에서 ‘전자기록’, ‘평가’, ‘DRAMBORA’ 등 보존 활동과 관련된 절차와 실제 적용 중심 연구, 제3구간에서 ‘데이터세트’, ‘행정정보시스템’, ‘소셜미디어’ 등 기록관리 환경 변화에 따른 기술적 구현 연구 주제로 진행되는 과정을 확인하였다.
This study aims to determine the research trends in archival preservation through keyword analysis, understand the current research status, and identify the research topics’ changes over time. The degree and betweenness centrality analyses were conducted and visualized on 463 “archival preservation studies” articles published from 2000 to 2021 in various academic journals, using NetMiner 4.0. The collected research papers were divided into three time periods according to when they were published: the first period (2000–2007), the second period (2008–2014), and the third period (2015–2021). The subject keywords for the research papers on archival preservation in Korea that have influence and expandability are as follows. Across all periods, these were “electronic records” and “long-term preservation.” In addition, if taken separately per period, the “OAIS reference model” and “electronic records” dominated the first and second periods, respectively, while the “records management standard table” and “long-term preservation” both dominated the third period. A conceptual framework and theory-oriented study for archival preservation, such as “digital preservation,” “digitalization,” and the “OAIS reference model,” dominated the first period. During the second period, more research focused on procedures and practical applications related to conservation activities, such as “electronic record,” “appraisal,” and “DRAMBORA.” In contrast, the majority of the research in the third period was on technical implementation according to the changes in the records management environment, such as “data set,” “administrative information system,” and “social media.”
이 글은 근현대기록물을 수집하고 있는 기관들을 대상으로 수집된 기록물의 유형을 살펴보고 기록관의 역할과 범위, 그리고 나아가야 할 방향에 대해 살펴보고자 쓰였다. 수집된 기록물을 대상으로 근현대기록물의 범위를 지정하고 기록관의 역할을 살펴봄으로써 기록물의 수집과 보존에 대한 균형을 이룰 수 있는 방법에 대해 고민하고 전문적인 역량을 키울 수 있는 방안에 대해 제안하고자 한다.
This article was written to examine the types of records gathered for institutions collecting modern and contemporary records, examine the role and scope of the archives, and determine the next steps. By specifying the scope of modern and contemporary records for collection and examining their role as a record repository, I would like to consider approaches to balancing the collection and preserving records and suggest methods for developing professional capabilities.