Var försiktig med q2!

okt 24, 2021
admin

Validering är en viktig aspekt av alla kvantitativa QSAR-modelleringar (QSAR = quantitative structure-activity relationship). I den här artikeln undersöks ett av de mest populära valideringskriterierna, leave-one-out cross-validated R2 (LOO q2). Ofta anses ett högt värde för denna statistiska egenskap (q2>0,5) vara ett bevis på modellens höga prediktiva förmåga. I det här dokumentet visar vi att detta antagande i allmänhet är felaktigt. När det gäller 3D QSAR har det tidigare konstaterats att det inte finns någon korrelation mellan ett högt LOO q2-värde och en QSAR-modells höga prediktiva förmåga. I det här dokumentet använder vi tvådimensionella (2D) molekylära deskriptorer och QSAR-metoden k nearest neighbors (kNN) för att analysera flera dataset. Ingen korrelation mellan värdena för q2 för träningsuppsättningen och den prediktiva förmågan för testuppsättningen hittades för någon av datamängderna. Ett högt värde på LOO q2 verkar således vara ett nödvändigt men inte tillräckligt villkor för att modellen ska ha en hög prediktiv förmåga. Vi hävdar att detta är den allmänna egenskapen hos QSAR-modeller som utvecklats med hjälp av LOO-korsvalidering. Vi betonar att extern validering är det enda sättet att fastställa en tillförlitlig QSAR-modell. Vi formulerar en uppsättning kriterier för utvärdering av QSAR-modellers prediktiva förmåga.

Lämna ett svar

Din e-postadress kommer inte publiceras.