使用 mol-infer 進行 QSPR 的逆向分析

使用 mol-infer 進行 QSPR 的逆向分析

從物性預測分子結構

 

技術介紹

        定量結構–性質關係(QSPR, Quantitative Structure-Property Relationship)通常是透過機器學習,根據分子或晶體結構來預測物理性質。本例中則進行逆向分析(inverse analysis),也就是從物理性質來預測分子結構。

J-OCTA 與京都大學永持研究室(Nagamochi Laboratory)正在開發的 mol-infer 工具之間具備介面整合功能 [1]

        首先,使用人工神經網路(ANN, Artificial Neural Network)根據分子結構來預測物理性質。接著,透過混合整數線性規劃(MILP, Mixed Integer Linear Programming)來解 ANN 的逆向運算。這種方法能快速且精確地執行 ANN 無法單獨完成的逆向推論。

        1 顯示用於測試計算的分配係數(partition coefficient)資料。首先,利用 1297 筆資料來訓練分子結構與物理性質之間的關係。

        接著使用 MILP 進行逆向運算,目標分配係數設定為 10.0。此時準備了一個作為種子(seed)的圖狀分子骨架結構,以及對應於官能基的樹狀結構,並以此來進行分子結構的預測。

        3 顯示所得的分子結構,此外也獲得了該結構的結構異構物(structural isomers)。再以正向預測方式估算該分子結構的物理性質,所得的分配係數為 9.8,顯示此結果幾乎能符合目標物性。

 

1. mol-infer的訓練資料與目標性質(分配係數 = 10.0)

 

2. 種子結構()與樹狀結構()

 

3. mol-infer所獲得的分子結構