Beware of q2!
Validação é um aspecto crucial de qualquer relação quantitativa estrutura-actividade (QSAR) de modelação. Este artigo examina um dos mais populares critérios de validação, o leave-one-out cross-validated R2 (LOO q2). Muitas vezes, um alto valor desta característica estatística (q2>0,5) é considerado como uma prova da alta capacidade preditiva do modelo. Neste artigo, mostramos que esta suposição é geralmente incorrecta. No caso do QSAR 3D, a falta da correlação entre a elevada LOO q2 e a elevada capacidade preditiva de um modelo QSAR foi estabelecida anteriormente . Neste trabalho, usamos descritores moleculares bidimensionais (2D) e k vizinhos mais próximos (kNN) método QSAR para a análise de vários conjuntos de dados. Não foi encontrada nenhuma correlação entre os valores de q2 para o conjunto de treinamento e a capacidade preditiva para o conjunto de teste para qualquer um dos conjuntos de dados. Assim, o alto valor de LOO q2 parece ser a condição necessária mas não suficiente para que o modelo tenha um alto poder preditivo. Argumentamos que esta é a propriedade geral dos modelos QSAR desenvolvidos usando a validação cruzada LOO. Enfatizamos que a validação externa é a única forma de estabelecer um modelo QSAR confiável. Nós formulamos um conjunto de critérios para avaliação da capacidade preditiva dos modelos QSAR.