ML-QSPR(Machine Learning QSPR)與材料資訊學
ML-QSPR(Machine Learning QSPR)與材料資訊學
以深度學習進行定量結構–性質關係 (QSPR, Quantitative Structure-Property Relationship) 分析
技術特色
J-OCTA 內建多種與材料資訊學 (Materials Informatics) 相關的功能,例如:
- 「建模 API」(Modeling API)(圖 1):讓使用者可透過 Python 腳本從分子建模到模擬進行全自動操作,無需使用圖形介面 (GUI),並能累積大量的物性資料。
- 從 SMILES 等分子結構中取得分子描述符的功能。
- 從多個分子結構中抽取共通結構 的功能。
- 機器學習式 QSPR(圖 2,定量結構–性質關係):使用圖卷積神經網路 (Graph Convolutional Neural Network, GCN) 來學習並預測分子結構與性質之間的關係。
圖 1. API模型
圖 2. ML-QSPR原理介紹
技術介紹
針對非晶態高分子,圖 3 與圖 4 分別以密度與玻璃轉移溫度為目標性質。機器學習 QSPR 與傳統 Bicerano 方法使用相同的實驗資料進行訓練,其中 80% 作為訓練資料、20% 作為測試資料。圖表顯示的是測試資料的比較結果。需要注意的是,所使用的分子描述符是以單體結構為基礎,因此未考慮分子量的影響。
各圖左側為機器學習 QSPR的結果,右側為傳統QSPR(Bicerano 方法)的結果。縱軸為 QSPR 預測值,橫軸為實驗值。可以看出,依訓練參數的不同,機器學習 QSPR 能呈現出更佳的相關性。
值得注意的是,機器學習 QSPR 允許使用者使用自己的資料進行訓練,因此使用者可以根據與目標分子結構相近的資料,自行建構專屬的 QSPR 模型。
圖 3. ML-QSPR與傳統(Bicerano)QSPR的密度比較
圖 4. 機器學習QSPR與傳統(Bicerano)QSPR的玻璃轉移溫度比較