Beware of q2!

10月 24, 2021
admin

バリデーションは、あらゆる定量的構造活性相関(QSAR)モデリングにおいて重要な側面である。 この論文では、最も一般的な検証基準の1つであるleave-one-out cross-validated R2 (LOO q2)について検証します。 多くの場合、この統計的特性(q2>0.5)の高い値は、モデルの高い予測能力の証明とみなされる。 この論文では、この仮定が一般的に間違っていることを示す。 3次元QSARの場合、高いLOO q2とQSARモデルの高い予測能力の間に相関がないことは、先に確立されている 。 本論文では、2次元分子記述子と最近傍探索法(kNN)を用いて、複数のデータセットを解析した結果、2次元分子記述子と最近傍探索法(kNN)は、高いLOO q2と高い予測能力の間に相関がないことを明らかにした。 その結果、いずれのデータセットにおいても、トレーニングセットのq2の値とテストセットの予測能力との間に相関は見られなかった。 したがって、LOO q2の値が高いことは、モデルが高い予測力を持つための必要条件であるが、十分条件ではないようである。 これは、LOOクロスバリデーションを用いて開発されたQSARモデルの一般的な特性であると主張する。 我々は、外部検証は信頼性の高いQSARモデルを確立するための唯一の方法であることを強調する。 我々は、QSARモデルの予測能力を評価するための一連の基準を定式化した

コメントを残す

メールアドレスが公開されることはありません。