바로가기메뉴

본문 바로가기 주메뉴 바로가기

logo

대규모 범죄 수사기록을 활용한 온톨로지 기반 서비스 구현 - 침입 절도 범죄 분야를 중심으로 -

Implementation of Ontology-based Service by Exploiting Massive Crime Investigation Records: Focusing on Intrusion Theft

한국문헌정보학회지 / Journal of the Korean Society for Library and Information Science, (P)1225-598X; (E)2982-6292
2019, v.53 no.1, pp.57-81
https://doi.org/10.4275/KSLIS.2019.53.1.057
고건우 (경기대학교 일반대학원 문헌정보학과)
김선우 (경기대학교 일반대학원 문헌정보학과)
박성진 (스펠릭스(Spelix))
노윤주 (경찰청 사서주사보)
최성필 (경기대학교)
  • 다운로드 수
  • 조회수

초록

온톨로지는 특정 분야의 특정 지식과 관련된 용어 및 용어 사이의 관계를 정의하는 복합 구조 사전이다. 국내외로 다양한 온톨로지 구축의 시도가 있었으나 대규모의 범죄 수사기록을 온톨로지로 구축하고 이를 통한 서비스를 구현한 사례는 존재하지 않았다. 따라서 본 논문은 비정형 데이터인 범죄 수사기록 문서 중 침입 절도 분야로부터 추출한 정보를 통해 온톨로지를 구축하고, 온톨로지 기반의 검색 서비스와 범행 장소 추천 서비스를 구현하는 과정을 설명한다. 검색 서비스의 성능을 파악하기 위하여 사건 검색에 대한 정확도 측정 방법 중 하나인 Top-K 방식의 정확도 측정을 실험하였고, 실험 집합에 대하여 최대 93.52%의 정확도를 얻었다. 또한, 범행 장소 추천 서비스의 성능을 파악하기 위한 실험 결과, 실험 데이터셋의 전체에 대해 적합한 단서 필드 조합을 얻어냈으며, F1-measure 76.19%의 성능으로 데이터베이스 내의 범행 장소 필드 정보를 교정할 수 있음을 확인하였다.

keywords
범죄 기록물, 비정형 데이터, 온톨로지, 온톨로지 서비스, 트리플, Criminal Record, Unstructured Data, Ontology, Ontology Service, Triple

Abstract

An ontology is a complex structure dictionary that defines the relationship between terms and terms related to specific knowledge in a particular field. There have been attempts to construct various ontologies in Korea and abroad, but there has not been a case in which a large scale crime investigation record is constructed as an ontology and a service is implemented through the ontology. Therefore, this paper describes the process of constructing an ontology based on information extracted from instrusion theft field of unstructured data, a crime investigation document, and implementing an ontology-based search service and a crime spot recommendation service. In order to understand the performance of the search service, we have tested Top-K accuracy measurement, which is one of the accuracy measurement methods for event search, and obtained a maximum accuracy of 93.52% for the experimental data set. In addition, we have obtained a suitable clue field combination for the entire experimental data set, and we can calibrate the field location information in the database with the performance of F1-measure 76.19% Respectively.

keywords
범죄 기록물, 비정형 데이터, 온톨로지, 온톨로지 서비스, 트리플, Criminal Record, Unstructured Data, Ontology, Ontology Service, Triple

참고문헌

1.

[단독] 52억짜리 AI 수사관 ‘클루'가 ‘살인의 추억' 재발 막는다. 2017 『중앙일보』. 12월 8일.

2.

고건우 외. 2018. 대규모 범죄 수사 기록을 활용한 온톨로지 기반 서비스 구현. 『한글 및 한국어정보처리 학술대회 논문집』. 2018년 10월 13일, 서울: 고려대학교 현대자동차 경영관: 477-481.

3.

국립중앙도서관. 2013. 국립중앙도서관 국가서지 Linkd Open Data 서비스. [online] [cited 2018. 9. 28.] <https://lod.nl.go.kr/home/about/introduction.jsp>

4.

권양섭. 2017. 범죄예방과 수사에 있어서 빅데이터 활용과 한계에 관한 연구. 『법학연구』, 17(1):179-198.

5.

김용훈, 정목동. 2017. LSA를 이용한 정형·비정형데이터 분석과 범죄 프로파일링 시스템 구현. 『멀티미디어학회논문지』, 20(1): 66-73.

6.

김평 외. 2008. OntoFrame 기반 학술정보 분석 서비스. 『정보과학회논문지: 소프트웨어 및 응용』, 35(7): 431-441.

7.

박경모, 임희숙, 박종현. 2003. Protege를 이용한 한의학의 구조화된 증상 입력을 위한 온톨로지개발. 『동의생리병리학회지』, 17(5): 1151-1156.

8.

박준영, 채명수, 정성관. 2016. 실시간 범죄 예측을 위한 랜덤포레스트 알고리즘 기반의 범죄 유형분류모델 및 모니터링 인터페이스 디자인 요소 제안. 『정보과학회 컴퓨팅의 실제 논문지』, 22(9): 455-460.

9.

방승환, 김태훈, 조현보. 2014. 범죄예측에서의 데이터마이닝 적용 가능성 연구: 절도범죄를 중심으로. 『한국컴퓨터정보학회논문지』, 19(12): 309-317.

10.

송영길, 정석원, 김학수. 2015. 위키피디아 기반 개체명 사전 반자동 구축 방법. 『정보과학회논문지』, 42(11): 1397-1403.

11.

위키백과. 2018. “온톨로지.” [online] [cited 2018. 6. 30.]<https://ko.wikipedia.org/wiki/%EC%98%A8%ED%86%A8%EB%A1%9C%EC%A7%80>

12.

정영석, 김진묵, 박구락. 2012. 범죄유형별 범죄발생 예측확률을 높일 수 있는 방법에 관한 연구. 『한국컴퓨터정보학회논문지』, 17(4): 163-172.

13.

조대웅, 최지웅, 김명호. 2014. 비정형 문서의 정보추출을 통한 OWL 온톨로지 구축 시스템의 설계및 구현. 『한국컴퓨터정보학회논문지』, 19(10): 23-33.

14.

한국정보화진흥원 지식자원활용부. 2014. 『2014 링크드 오픈 데이터 국내 구축 사례집』. 서울: 한국정보화진흥원 지식자원활용부.

15.

황미녕 외. 2012. 연구 개발 트렌드 분석을 위한 기술 지식 온톨로지 구축. 『한국콘텐츠학회논문지』, 12(12): 35-45.

16.

Abasolo, J. M. and Gomez, M. 2000. “MELISA: An ontology-based agent for information retrieval in medicine.” In Proceedings of the first international workshop on the semantic web (SemWeb2000), 73-82.

17.

Asaro, C. et al. 2003. “A domain ontology: Italian crime ontology.” In Proceedings of the ICAIL 2003 Workshop on Legal Ontologies & Web based legal information management.

18.

Franz INC. Gruff. [online] [cited 2018. 9. 28.] <https://franz.com/agraph/gruff/>

19.

Noy, N. F. and McGuinness, D. L. 2001. “Ontology development 101: A guide to creating your first ontology.” Stanford Knowledge Systems Laboratoryand Technical Report KSL-01-05and Stanford Medical Informaticsand Technical Report SMI-2001-0880.

20.

Oh, S. 2017. “Top-k Hierarchical Classification.” In AAAI, 2450-2456.

21.

Raimond, Y. et al. F. 2007. “The Music Ontology.” In Proceedings of the 8th International Conference on Music Information Retrieval, ISMIR 2007, September 23-27, 2007, Vienna, Austria.

한국문헌정보학회지