온톨로지는 특정 분야의 특정 지식과 관련된 용어 및 용어 사이의 관계를 정의하는 복합 구조 사전이다. 국내외로 다양한 온톨로지 구축의 시도가 있었으나 대규모의 범죄 수사기록을 온톨로지로 구축하고 이를 통한 서비스를 구현한 사례는 존재하지 않았다. 따라서 본 논문은 비정형 데이터인 범죄 수사기록 문서 중 침입 절도 분야로부터 추출한 정보를 통해 온톨로지를 구축하고, 온톨로지 기반의 검색 서비스와 범행 장소 추천 서비스를 구현하는 과정을 설명한다. 검색 서비스의 성능을 파악하기 위하여 사건 검색에 대한 정확도 측정 방법 중 하나인 Top-K 방식의 정확도 측정을 실험하였고, 실험 집합에 대하여 최대 93.52%의 정확도를 얻었다. 또한, 범행 장소 추천 서비스의 성능을 파악하기 위한 실험 결과, 실험 데이터셋의 전체에 대해 적합한 단서 필드 조합을 얻어냈으며, F1-measure 76.19%의 성능으로 데이터베이스 내의 범행 장소 필드 정보를 교정할 수 있음을 확인하였다.
An ontology is a complex structure dictionary that defines the relationship between terms and terms related to specific knowledge in a particular field. There have been attempts to construct various ontologies in Korea and abroad, but there has not been a case in which a large scale crime investigation record is constructed as an ontology and a service is implemented through the ontology. Therefore, this paper describes the process of constructing an ontology based on information extracted from instrusion theft field of unstructured data, a crime investigation document, and implementing an ontology-based search service and a crime spot recommendation service. In order to understand the performance of the search service, we have tested Top-K accuracy measurement, which is one of the accuracy measurement methods for event search, and obtained a maximum accuracy of 93.52% for the experimental data set. In addition, we have obtained a suitable clue field combination for the entire experimental data set, and we can calibrate the field location information in the database with the performance of F1-measure 76.19% Respectively.
[단독] 52억짜리 AI 수사관 ‘클루'가 ‘살인의 추억' 재발 막는다. 2017 『중앙일보』. 12월 8일.
고건우 외. 2018. 대규모 범죄 수사 기록을 활용한 온톨로지 기반 서비스 구현. 『한글 및 한국어정보처리 학술대회 논문집』. 2018년 10월 13일, 서울: 고려대학교 현대자동차 경영관: 477-481.
국립중앙도서관. 2013. 국립중앙도서관 국가서지 Linkd Open Data 서비스. [online] [cited 2018. 9. 28.] <https://lod.nl.go.kr/home/about/introduction.jsp>
권양섭. 2017. 범죄예방과 수사에 있어서 빅데이터 활용과 한계에 관한 연구. 『법학연구』, 17(1):179-198.
김용훈, 정목동. 2017. LSA를 이용한 정형·비정형데이터 분석과 범죄 프로파일링 시스템 구현. 『멀티미디어학회논문지』, 20(1): 66-73.
김평 외. 2008. OntoFrame 기반 학술정보 분석 서비스. 『정보과학회논문지: 소프트웨어 및 응용』, 35(7): 431-441.
박경모, 임희숙, 박종현. 2003. Protege를 이용한 한의학의 구조화된 증상 입력을 위한 온톨로지개발. 『동의생리병리학회지』, 17(5): 1151-1156.
박준영, 채명수, 정성관. 2016. 실시간 범죄 예측을 위한 랜덤포레스트 알고리즘 기반의 범죄 유형분류모델 및 모니터링 인터페이스 디자인 요소 제안. 『정보과학회 컴퓨팅의 실제 논문지』, 22(9): 455-460.
방승환, 김태훈, 조현보. 2014. 범죄예측에서의 데이터마이닝 적용 가능성 연구: 절도범죄를 중심으로. 『한국컴퓨터정보학회논문지』, 19(12): 309-317.
송영길, 정석원, 김학수. 2015. 위키피디아 기반 개체명 사전 반자동 구축 방법. 『정보과학회논문지』, 42(11): 1397-1403.
위키백과. 2018. “온톨로지.” [online] [cited 2018. 6. 30.]<https://ko.wikipedia.org/wiki/%EC%98%A8%ED%86%A8%EB%A1%9C%EC%A7%80>
정영석, 김진묵, 박구락. 2012. 범죄유형별 범죄발생 예측확률을 높일 수 있는 방법에 관한 연구. 『한국컴퓨터정보학회논문지』, 17(4): 163-172.
조대웅, 최지웅, 김명호. 2014. 비정형 문서의 정보추출을 통한 OWL 온톨로지 구축 시스템의 설계및 구현. 『한국컴퓨터정보학회논문지』, 19(10): 23-33.
한국정보화진흥원 지식자원활용부. 2014. 『2014 링크드 오픈 데이터 국내 구축 사례집』. 서울: 한국정보화진흥원 지식자원활용부.
황미녕 외. 2012. 연구 개발 트렌드 분석을 위한 기술 지식 온톨로지 구축. 『한국콘텐츠학회논문지』, 12(12): 35-45.
Abasolo, J. M. and Gomez, M. 2000. “MELISA: An ontology-based agent for information retrieval in medicine.” In Proceedings of the first international workshop on the semantic web (SemWeb2000), 73-82.
Asaro, C. et al. 2003. “A domain ontology: Italian crime ontology.” In Proceedings of the ICAIL 2003 Workshop on Legal Ontologies & Web based legal information management.
Franz INC. Gruff. [online] [cited 2018. 9. 28.] <https://franz.com/agraph/gruff/>
Noy, N. F. and McGuinness, D. L. 2001. “Ontology development 101: A guide to creating your first ontology.” Stanford Knowledge Systems Laboratoryand Technical Report KSL-01-05and Stanford Medical Informaticsand Technical Report SMI-2001-0880.
Oh, S. 2017. “Top-k Hierarchical Classification.” In AAAI, 2450-2456.
Raimond, Y. et al. F. 2007. “The Music Ontology.” In Proceedings of the 8th International Conference on Music Information Retrieval, ISMIR 2007, September 23-27, 2007, Vienna, Austria.