ACOMS+ 및 학술지 리포지터리 설명회

  • 한국과학기술정보연구원(KISTI) 서울분원 대회의실(별관 3층)
  • 2024년 07월 03일(수) 13:30
 

  • P-ISSN1225-0163
  • E-ISSN2288-8985
  • SCOPUS, ESCI, KCI

논문 상세

Home > 논문 상세
  • P-ISSN 1225-0163
  • E-ISSN 2288-8985

논문 상세

    다양한 유기화합물의 비등점 예측을 위한 QSPR 모델 및 이의 적용구역

    QSPR model for the boiling point of diverse organic compounds with applicability domain

    분석과학 / Analytical Science and Technology, (P)1225-0163; (E)2288-8985
    2015, v.28 no.4, pp.270-277
    https://doi.org/10.5806/AST.2015.28.4.270
    신성은 (사단법인 분자설계연구소)
    차지영 ((사)분자설계연구소)
    김광연 (사단법인 분자설계연구소)
    노경태 ((사)분자설계연구소, 연세대학교 생명공학과)
    • 다운로드 수
    • 조회수

    초록

    비등점은 유기물의 물리화학적 성질을 특정하는데 있어 매우 근본적 요소 중 하나이다. 그러나기존의 정량적 구조-물성 상관관계식들은 고에너지 물질 등과 같은 특정 물질 군에 대한 실험값들의 부족 등으로 인해 제한적인 응용성을 가지고 있었다. 본 연구에서는 서로 다른 출처로부터의 5,923개의 비등점 자료를 확보하였으며, 이에는 일반적 유기화합물과 더불어 특수목적을 가지는 분자들을 포함하였고, 이들 수집된 데이터 셋을 이용하여 새로운 비등점 예측모델을 개발하는데 사용하였다. 다양한 학습방법을 이용하여 새로이 수집된 데이터 셋을 이용한 2차원 분자 표현자에 기반한 비등점 모델을 도출하였다. 개발된 예측모델의 적정성과 견고성을 확인하였고, 훈련 셋의 표현자에 기반한 비등점 예측모델의적용구역을 도출하였다.

    keywords
    Boiling point, QSPR, machine learning, applicability domain

    Abstract

    Boiling point (BP) is one of the most fundamental physicochemical properties of organic compounds to characterize and identify the thermal characteristics of target compounds. Previously developed QSPR equations, however, still had some limitation for the specific compounds, like high-energy molecules, mainly because of the lack of experimental data and less coverage. A large BP dataset of 5,923 solid organic compounds was finally secured in this study, after dedicated pre-filtration of experimental data from different sources, mostly consisting of compounds not only from common organic molecules but also from some specially used molecules, and those dataset was used to build the new BP prediction model. Various machine learning methods were performed for newly collected data based on meaningful 2D descriptor set. Results of combined check showed acceptable validity and robustness of our models, and consensus approaches of each model were also performed. Applicability domain of BP prediction model was shown based on descriptor of training set.

    keywords
    Boiling point, QSPR, machine learning, applicability domain


    참고문헌

    1

    1. B. Moller, J. Rarey and D. Ramjugernath, J. Mol. Liq., 143(1), 52-63 (2008).

    2

    2. R. Ceriani, R. Gani and A. J. A. Meirelles, Fluid Phase Equilib., 283(1), 49-55 (2009).

    3

    3. J. Marrero and R. Gani, Fluid Phase Equilib., 183, 183-208 (2001).

    4

    4. Y. S. Park, J. H. Lee, H W. Park and S. K. Lee, Anal. Sci. Tech., 28(3), 187-195 (2015).

    5

    5. Physical/Chemical Property Database (PHYSPROP), SRC Environmental Science Center, Syracuse Research Corporation, Syracuse, New York, 1994-2015.

    6

    6. H. Bathelt, F. Volk, and M. Weindel, The ICT-Database of Thermochemical Values, 8th update, Fraunhofer- Institut für Chemische Technologie (ICT), Pfinztal, Germany, 2008.

    7

    7. DIPPR(Design Institute for Physical Property Data), American Institute of Chemical Engineers, New Mexico, 2015.

    8

    8. PreADMET Ver.2.0.2.0, BMDRC, Seoul, Korea, 2007.

    9

    9. RapidMiner Ver.5.3.015, Rapid-I, Stockumer, Germany, 2014.

    10

    10. A. Tropsha, P. Gramatica and V. K. Gombar, QSAR Combi. Sci., 22(1), 69-77 (2003).

    상단으로 이동

    분석과학