
본문 바로가기 주메뉴 바로가기

ACOMS+ 및 학술지 리포지터리 설명회

  • 한국과학기술정보연구원(KISTI) 서울분원 대회의실(별관 3층)
  • 2024년 07월 03일(수) 13:30


검색어: , 검색결과: 193
이지연(연세대학교) ; 백우진(건국대학교) 2006, Vol.23, No.2, pp.61-79 https://doi.org/10.3743/KOSIM.2006.23.2.061

본 연구는 특허 및 상표 검색 개선을 위한 방법을 제안하고자 하는 목적에서 출발하였다. 이를 위해 193일간 한국특허정보원의 특허기술정보서비스를 이용한 17,559명의 이용자가 작성한 100,016개의 질의문에 대한 로그 데이터를 분석하였다. 개별적인 질의로그 분석 이외에, 2,202개의 복수 질의문을 이용한 탐색세션을 분석함으로써 검색 개선을 위한 추가적인 단서를 발견하였다. 분석결과에 의하면, 특허 및 상표검색은 일반적인 웹 검색의 유형과 유사한데, 특히 질의문의 길이가 짧다는 측면에서 매우 흡사하다. 그러나 특허 및 상표검색의 경우, 일반 웹 검색보다 불리언 연산자를 많이 사용하고 있었다. 복수 질의문 분석을 통해 이용자들이 질의문을 재작성하는데 도움이 될 수 있는 탐색기능을 제안할 수 있었다. 복수의 질의문으로 구성된 탐색세션을 분석한 결과, 이용자들은 질의문을 재작성하기 위하여 부연하기, 특정화하기, 일반화하기, 교체하기, 중단하기와 같은 방법을 사용하고 있음을 알 수 있었다.


To come up with the recommendations to improve the patent & trademark retrieval efficiency, 100,016 patent & trademark search requests by 17,559 unique users over a period of 193 days were analyzed. By analyzing 2,202 multi-query sessions, where one user issuing two or more queries consecutively, we discovered a number of retrieval efficiency improvements clues. The session analysis result also led to suggestions for new system features to help users reformulating queries. The patent & trademark retrieval users were found to be similar to the typical web users in certain aspects especially in issuing short queries. However, we also found that the patent & trademark retrieval users used Boolean operators more than the typical web search users. By analyzing the multi-query sessions, we found that the users had five intentions in reformulating queries such as paraphrasing, specialization, generalization, alternation, and interruption, which were also used by the web search engine users.


본 연구는 공공기록물 중 대다수를 차지하고 있는 정부저작물의 이용 활성화를 위하여 저작권의 문제를 다루었다. 미국과 영국의 저작권법에서 정부저작물에 대한 규정 및 정책을 국내 저작권법의 규정과 비교 분석하였다. 그 결과 국내의 저작권법이 이들 두 나라에 비하여 정부저작물에 대한 보호를 더 폭넓게 함으로써 이용에 장애가 되고 있음을 발견하였다. 또한 정부저작물 생산기관인 각국의 정부웹사이트와 국가 대표 기록관의 저작권 규정과 관리 현황을 조사한 결과 국내의 정부웹사이트와 기록관이 기록정보 서비스에 더 제한적임을 발견하였다. 이러한 문제점을 해결하기 위하여 본 연구는 국내의 저작권법에서 정부저작물에 대한 정의를 추가하고 관련 규정을 수정하고, 정부기관에서는 이미 정부에서 개발한 정보공유라이선스를 각 부처의 저작물에 적용할 필요가 있음을 제안하였다.


This paper examines copyright problems of government works which take up a considerable part of public records. The provisions related to government works of the copyright laws of United States and United Kingdom are examined for the purpose of comparison with similar provisions in copyright act of Korea. The copyright act of Korea protects more strongly government works than U.K and U.S. therefore is an obstacle for use of the works. Also websites of governments and national archives are examined for their copyright policies in the process of service of government works. This paper found that the copyright policies of Korean governments' official websites and the National Archives and Records Service limits free use of government works. This study proposed that the provision of definition for government works need to be added to the copyright act of Korea and the provision 7 should be revised. And open access license V.2 which developed by Korean government should be applied to government works.


본 연구는 웹에서 접근 가능한 내용기반 음악검색(CBMR) 시스템들을 조사하여, 탐색질의의 종류, 접근점, 입출력, 탐색기능, 데이터베이스 성격과 크기 등의 관점에서 특성을 비교 분석하고자 하였다. 비교 분석에 사용된 특성을 추출하기 위해 내용기반 음악정보의 특성과 시스템 구축에 필요한 파일의 변환, 멜로디 추출 및 분할, 색인자질 추출과 색인, 매칭에 사용되는 기술들을 선행연구로 리뷰하였다. 15개의 시스템을 분석한 결과 다음과 같은 특성과 문제점이 분석되었다. 첫째, 도치색인, N-gram 색인, 불리언 탐색, 용어절단검색, 키워드 및 어구 탐색, 음길이 정규화, 필터링, 브라우징, 편집거리, 정렬과 같은 텍스트 정보 검색 기법이 CBMR에서도 검색성능을 향상시키는 도구로 사용되고 있었다. 둘째, 시스템들은 웹에서 크롤링하거나 탐색질의를 DB에 추가하는 등으로 DB의 성장과 실용성을 위한 노력을 하고 있었다. 셋째, 개선되어야 할 문제점으로 선율이나 주선율을 추출하는데 부정확성, 색인자질을 추출할 때 사용되는 불용음(stop notes)을 탐색질의에서도 자동 제거할 필요성, 옥타브를 무시한 solfege 검색의 문제점 등이 분석되었다.


This study compared and analyzed 15 CBMR (Content-based Music Retrieval) systems accessible on the web in terms of DB size and type, query type, access point, input and output type, and search functions, with reviewing features of music information and techniques used for transforming or transcribing of music sources, extracting and segmenting melodies, extracting and indexing features of music, and matching algorithms for CBMR systems. Application of text information retrieval techniques such as inverted indexing, N-gram indexing, Boolean search, truncation, keyword and phrase search, normalization, filtering, browsing, exact matching, similarity measure using edit distance, sorting, etc. to enhancing the CBMR; effort for increasing DB size and usability; and problems in extracting melodies, deleting stop notes in queries, and using solfege as pitch information were found as the results of analysis.


본 연구에서는 주요 검색 포털들의 검색어 추천 서비스를 분석, 평가하였다. 이 연구에서는 네이버와 구글 코리아를 대상으로 추천되는 연관 검색어의 적합도 및 최신성을 평가하고, 연관 검색어의 개수 및 분포, 연관 검색어가 제공되지 않는 질의의 특징을 조사하였다. 또한 연관 검색어의 유형을 질의와 연관 검색어의 관계 측면에서 분석하고, 연관 검색어들 중 유해 검색어의 유형 및 특징, 비표준어의 유형 및 특징도 조사하였다. 마지막으로, 한글 질의와 영어 질의, 대중적인 질의와 전문적인 질의의 연관 검색어의 특징을 비교하였다. 연구 결과, 네이버가 구글보다 연관 검색어의 적합도와 최신성이 다소 높은 것으로 나타났다. 또한 구글과 네이버 모두 새로운 연관 검색어를 제시하기보다는 질의에 단어를 추가 또는 삭제하거나, 질의와 동일한 검색어나 동의어 검색어를 제공하는 경우가 많은 것으로 나타났다. 본 연구의 결과는 향후 포털들의 검색어 추천 서비스의 개선에 활용될 수 있을 것으로 기대된다.


This study aims to analyze and evaluate term suggestion services of major search portals, Naver and Google Korea. In particular, this study evaluated relevance and currency of related search terms provided, and analyzed characteristics such as number and distribution of terms, and queries that did not produce terms. This study also analyzed types of terms in terms of the relationship between queries and terms, and investigated types and characteristics of harmful terms and terms with grammatical errors. Finally, Korean queries and English queries, and popular queries and academic queries were compared in terms of the amount and relevance of search terms provided. The results of this study show that the relevance and currency of Naver's related search terms are somewhat higher than those of Google. Both Naver and Google tend to add terms to or delete terms from original queries, and provide identical search terms or synonym terms rather than providing entirely new search terms. The results of this study can be implemented to the portal's effective development of term suggestion services.


본 연구에서는 2000년부터 2009년까지 10년 동안 국내의 학술지에 발표된 사회 연결망 분석과 관련된 논문들을 대상으로 하여 연도별 연구논문 추이와 학문분야별로 구분하여 연구동향을 분석하였다. 연구결과 사회 연결망 분석을 적용한 연구는 총 163편으로서 연차적으로 증가하여 수행되고 있으며, 특히 최근에 많은 연구들이 발표되고 있음을 확인할 수 있었다. 사회연결망 분석은 다양한 분야에서 적용되고 있었고 특히 경영학, 교육학, 행정학 분야 등에서 많이 적용되고 있는 것으로 나타났으며 단독연구보다는 공동연구가 많은 것으로 나타났다. 문헌정보학 분야에서는 웹계량정보학을 포함한 계량정보학 분야에서 최근 들어 상대적으로 많이 사용되고 있는 것으로 나타났다. 이러한 연구결과는 정보학 영역에 있어 사회 연결망 분석의 접목 가능성을 확인하고, 향후 사회 연결망 분석을 정보학에 활용하기 위한 기초자료로 활용할 수 있을 것이다.


In this study, we analyzed the research trend of social network analysis. We investigated how this topic can be linked to the information science. We analyzed 163 articles that were retrieved from searching “social network analysis” in the keyword search field from 2000 to 2009. The study revealed the fast growth of the research of social network analysis in recent years. Also, the study showed that social network analysis has been applied to many cognate disciplines including management science, education science, and administration science. Finally, the study showed that social network analysis is a field equally important to information science as to other disciplines. Particularly, the study demonstrated that social network analysis can be applied to bibliometrics, including webmetrics.



This study constructed an ontology targeting journal articles and evaluated its performance. Also, the performance of a triple structure ontology was compared with the knowledge base of an inverted index file designed for a simple keyword search engine. The coverage was three years of articles published in the Journal of the Korean Society for Information Management from 2007 to 2009. Protégé was used to construct an ontology, whilst utilizing an inverted index file to compare performance. The concept ontology was manually established, and the bibliography ontology was automatically constructed to produce an OWL concept ontology and an OWL bibliography ontology, respectively. This study compared the performance of the knowledge base of the ontology, using the Jena search engine with the performance of an inverted index file using the Lucene search engine. As a result, The Lucene showed higher precision rate, but Jena showed higher recall rate.


공공데이터는 공공기관의 정책 수립 등의 공적 기능을 수행하기 위하여 많은 비용을 들여 수집되고 있으나 대부분은 사일로(silos)로 방치되고 있다. 우리나라도 공공데이터를 개방하려는 움직임이 활발해지고 있으나 일부 기관을 중심으로 OpenAPI 형식으로 데이터를 제공하는 등 제한적인 수준에 머물고 있다. 국가차원에서 LOD(Linking Open Data) 시범사업으로 공공DB 피디아를 구축하면서 최근 들어 공공데이터 활용을 위한 링크드 데이터 구축이 활발하게 논의되고 있다. 본 연구에서는 관련연구 및 공공부문을 중심으로 한 링크드 데이터 구축 사례를 바탕으로 공공데이터 활용을 위한 국가 연계체계 사업인 공공DB 피디아 구축과정에서 도출된 문제를 파악하고 기존의 국가DB 연계체계 구축과정을 참고하여 그 해결 방안을 제시하였다.


Public information has been collected in various fields with huge costs in order to serve public purposes such as public agencies' policy-making. However, the collected public information has been overlooked as silos. In korea, many attempts have been made to open the public information to the public only to result in limited extent, where OpenAPI data is being presented by some agencies. Recently, at the national level, the LOD(Linking Open Data) project has built the national DB, initiating the ground on which the linked data will be based for their active availability. This study has outlined overall problems in earlier projects which have built up national linking systems based on linked data for public data use. A possible solution has been proposed with a real experience of having set up an existing national DB of Korean public agencies.

이선우(한국교육학술정보원 KORUS 연구원) ; 장우권(전남대학교 문헌정보학과 교수) 2021, Vol.38, No.3, pp.141-174 https://doi.org/10.3743/KOSIM.2021.38.3.141

이 연구에서는 COVID-19 발병 전후 대학도서관 홈페이지 실제 이용 데이터를 조사하여 이용자들의 이용행태를 분석하고, 바이러스 발병 이전과 이후의 데이터를 대조하여, 팬데믹 상황에서 대학도서관이 보다 효율적인 정보서비스를 할 수 있도록 개선방안을 제안하고자 한다. 이 연구는 C대학교 홈페이지에서 이루어진 이용자 트래픽을 ‘구글애널리틱스를 활용하여’, COVID-19 바이러스가 발병하기 이전인 2018년 1월부터 2018년 12월까지와 바이러스 발병 이후인 2020년 1월부터 2020년 12월까지를 비교분석하였다. 웹 트래픽 변수는 세션, 사용자, 페이지뷰 수, 세션당 페이지 수, 평균 세션 시간, 이탈률을 측정지표를 기준으로 ‘이용자 정보’, ‘경로’, ‘사이트 행동’ 3가지 특성으로 구분하여 분석하였다. 연구결과를 요약하면, 첫째, COVID-19 발병 이전 1월 1일부터 1월 20일까지의 데이터와 대조했을 때, 2018년 이후 사용자, 신규방문자, 세션 모두 3년 동안 감소하였지만, 2020년은 2019년 대비 사용자, 신규 방문자, 세션 모두 증가하였으며, 2020년 바이러스 발병 이전 상승세를 보였던 사용자당 세션 수, 페이지뷰 수, 세션당 페이지 수가 크게 증가하였다. 둘째, 사회적 거리 두기 2단계로 격상함에 따라 대학도서관 홈페이지 이용 추이에도 변화가 나타났다. 재학생이 가장 적었던 2020년, 2018년 대비 2020년에 페이지뷰가 10만 뷰 더 증가했으며, 세션당 페이지 수 역시 2018년 대비 약 2페이지를 더 조회한 10.46을 기록했다. 이탈률 역시 2018년, 2019년 14.38을 기록한데 반해, 2020년 1% 포인트 가량 감소한 13.05를 기록하여 사회적 거리 두기 단계가 격상한 시점에, 더욱 활발한 홈페이지 이용이 이루어졌다.


In this study, by examining the actual usage data of the university library website before and after COVID-19 outbreak, the usage behavior of users was analyzed, and the data before and after the virus outbreak was compared, so that university libraries can provide more efficient information services in a pandemic situation. We would like to suggest ways to improve it. In this study, the user traffic made on the website of University C was ‘using Google Analytics’, from January 2018 to December 2018 before the oneself of the COVID-19 virus and from January 2020 to 2020 after the outbreak of the virus. A comparative analysis was conducted until December. Web traffic variables were analyzed by classifying them into three characteristics: ‘User information’, ‘Path’, and ‘Site behavior’ based on metrics such as session, user, number of pageviews, number of pages per session time, and bounce rate. To summarize the study results, first, when compared with data from January 1 to January 20 before the oneself of COVID-19, users, new visitors, and sessions all increased compared to the previous year, and the number of sessions per user, number of pageviews, and number of pages per session, which showed an upward trend before the virus outbreak in 2020, increased significantly. Second, as social distancing was upgraded to the second stage, there was also a change in the use of university library websites. In 2020 and 2018, when the number os students was the lowest, the number of page views increased by 100,000 more in 2020 compared to 2018, and the number of pages per session also recorded10.46, which was about 2 more pages compared to 2018. The bounce rate also recorded 14.38 in 2018 and 2019, but decreased by 1 percentage point to 13.05 in 2020, which led to more active use of the website at a time when social distancing was raised.


본 연구는 AACR2와 이를 대체하는 새로운 목록규칙인 RDA의 규칙을 비교하여, RDA에 대한 이해를 높이고, 우리나라의 한국목록규칙에서 고려해야 할 사항을 파악하기 위한 것이다. RDA는 모든 유형의 자원을 서지제어할 수 있는 구조로 International Cataloging Principles(2009), FRBR, FRAD를 구현하기 위한 목록규칙이며, 국제적인 환경에 융통성 있게 적용가능하다. RDA는 웹환경에 맞는 시멘틱웹으로 구현이 가능하도록 집중기능과 다양한 관계에 기반을 두고 있어 미래의 목록에 큰 영향을 줄 것이기 때문에 국내에서도 이를 반영하는 연구가 필요하다. 비교는 JSC for Development of RDA의 2008년 RDA 초안을 기반으로 저작, 표현형, 구현형의 기술규칙을 대상으로 분석하였다. 구현형에서는 표제, 자료유형, 책임사항, 판사항, 발행사항, 형태사항, 총서사항의 기술영역별로, 저작과 표현형에서는 저작 유형에 따른 채택접근점을 중심으로 RDA와 AACR2 규칙 중에서 변경된 사항을 중심으로 살펴보았다. 본 연구는 RDA에서 제시한 목록규칙을 바탕으로 앞으로 목록의 발전 방향을 파악할 수 있으며, 국내의 목록규칙 개정 시에도 많은 도움이 될 것이다.


This study is to compare the descriptive cataloging rules between AACR2 and RDA, and then to find a direction of future cataloging and KCR 4. RDA is new cataloging rules that embody the International Cataloging Principles(2009), FRBR and FRAD. It is a structure of bibliographic control of all kinds of resources, and the rules can be flexibly applicable in the international cataloging community. It is critical to embody RDA in KCR 4 because RDA is likely to affect the future cataloging through its collocation function and relation function to construct semantic web of OPAC. This study analyzed the descriptive rules of work, expression, and manifestation based on RDA draft(2008) of JSC for Development of RDA. It analyzed the changes in the cataloging rules from AACR2 to RDA in such descriptive areas as title, type of resources, statement of responsibility, edition, publication, physical description and series in the manifestation level, and the preferred access points in both expression and work levels. The findings of this study will provide implications in revising KCR4.

양명석(한국과학기술정보연구원) ; 강남규(한국과학기술정보연구원) ; 김윤정(한국과학기술정보연구원) ; 최광남(한국과학기술정보연구원) ; 김영국(충남대학교) 2012, Vol.29, No.4, pp.123-142 https://doi.org/10.3743/KOSIM.2012.29.4.123

최근 효과적인 정보검색을 제공하기 위해 시맨틱 웹을 비롯한 다양한 검색기법들을 사용하고 있다. 이중에서 효과적인 방법은 온톨로지를 이용한 검색기술을 적용하는 것이라 할 수 있다. 본 논문에서는 국가과학기술지식정보서비스(NTIS)에서 구축한 국가R&D정보를 분석하여 온톨로지를 구축하고, 이용자가 관심있어 하는 주제분야(과제, 인물, 성과, 기관)를 중심으로 온톨로지의 객체관계를 표현하고 정보를 탐색하기 위한 국가R&D지식맵(knowledge map)을 구축하였다. 국가R&D지식맵은 사용자가 선택한 객체를 중심노드로 설정하여, 주제분야를 노드로 표현하고, 객체와 주제분야간의 관계를 분석하여 사용자가 관심 있어 하는 질의를 주제분야의 하위노드로 표현하였다. 사용자가 하위노드의 질의를 선택하면 시스템에서는 선택한 질의를 온톨로지로부터 추론할 수 있는 SPAQL 질의어를 생성하고 추론엔진으로부터 검색결과를 받아 사용자에게 제시하였다.


To develop an intelligent search engine to help users retrieve information effectively, various methods, such as Semantic Web, have been used, An effective retrieval method of such methods uses ontology technology. In this paper, we built National R&D ontology after analyzing National R&D Information in NTIS and then implemented National R&D Knowledge Map to represent and retrieve information of the relationship between object and subject (project, human information, organization, research result) in R&D Ontology. In the National R&D Knowledge Map, center-node is the object selected by users, node is subject, subject's sub-node is user's favorite query in National R&D ontology after analyzing the relationship between object and subject. When a user selects sub-node, the system displays the results from inference engine after making query by SPARQL in National R&D ontology.
