본고는 인도의 문헌들 가운데 ‘논서’(śāstra)라 통칭되는 학술적 장르의 문헌군을 TEI 가이드라인을 준수하여 인코딩할 수 있는 방안에 대해 논한다. SARIT 등의 프로젝트에서 인도의 문헌에 대한 텍스트 인코딩 기준안을 제시하고 있지만, 이는 문헌학적인 정보에 대한 인코딩만을 중점적으로 다루고 있다. 해석적 작업을 하는 연구자들의 관점에서 문헌 디지털화의 유용성을 최대화하기 위해서는 해석적 정보를 데이터화 해야 할 필요가 있다. 본고는 참조정보(언급정보, 인용정보)와 개념어 사용정보를 데이터로 간주하고 이를 TEI에 부합하고 SARIT과 호환가능한 스키마로 개발할 수 있는 방안을 제안한다. 이를 통해 성립하는 데이터세트은 인도철학에 대한 연구를 보다 견고한 역사적 기반 위에 올려놓을 것이다.
This paper discusses how the scholarly genre of Indian literature known as śāstra can be encoded according to TEI guidelines. While projects such as SARIT have proposed text encoding standards for Indian literature, they mainly focus on encoding philological information. To better serve the need of interpretatively oriented researchers, interpretive information is to also be defined as data. This paper proposes to consider reference information (mentions, quotations) and concept-word usage information as data and to develop a schema that is TEI-conformant and SARIT-compatible. The resulting dataset will place the study of Indian philosophy on a more solid historical footing.