¡Cuidado con el q2!
La validación es un aspecto crucial de cualquier relación cuantitativa estructura-actividad (QSAR) de modelado. Este artículo examina uno de los criterios de validación más populares, el R2 validado cruzado sin límite (LOO q2). A menudo, un valor alto de esta característica estadística (q2>0,5) se considera una prueba de la alta capacidad de predicción del modelo. En este trabajo, demostramos que esta suposición es generalmente incorrecta. En el caso de QSAR 3D, la falta de correlación entre la alta LOO q2 y la alta capacidad de predicción de un modelo QSAR se ha establecido anteriormente. En este trabajo, utilizamos descriptores moleculares bidimensionales (2D) y el método QSAR de los vecinos más cercanos (kNN) para el análisis de varios conjuntos de datos. No se encontró correlación entre los valores de q2 para el conjunto de entrenamiento y la capacidad de predicción para el conjunto de prueba para ninguno de los conjuntos de datos. Así, el alto valor de LOO q2 parece ser la condición necesaria pero no suficiente para que el modelo tenga un alto poder predictivo. Argumentamos que ésta es la propiedad general de los modelos QSAR desarrollados utilizando la validación cruzada LOO. Destacamos que la validación externa es la única forma de establecer un modelo QSAR fiable. Formulamos un conjunto de criterios para la evaluación de la capacidad predictiva de los modelos QSAR.