Una misura può essere considerata "buona" se è affidabile, sensibile e valida (Tab. 3.II); l'affidabilità (reliability) dipende dalla consistenza dello strumento (i cui item devono misurare sempre ed allo stesso modo la stessa entità), la sensibilità è la sua capacità di discriminare fra fenomeni diversi, la validità (validity) dipende dall'accuratezza con cui misura ciò che si presume debba misurare. La mancanza di affidabilità e di validità è responsabile, rispettivamente, di errori casuali e di errori sistematici.
Validità
La validità è la capacità di una RS di misurare effettivamente ciò che l'Autore si proponeva di misurare. Si distinguono diversi tipi di validità: per contenuto, per criterio, per costrutto, concorrente, predittiva, discriminate, fattoriale, nominale (Tab. 3.III).
Validità per contenuto
La validità per contenuto si riferisce al fatto che gli item esplorino completamente l'area che si intende indagare. Data la grande variabilità del vissuto umano, normale e patologico, non sarebbe possibile, in pratica, esplorare tutti gli aspetti di un determinato problema per ciascun paziente; per tale motivo una RS è considerata valida per contenuto quando i suoi item coprono un'area sufficientemente rappresentativa del settore psicopatologico che si intende misurare. La validità per contenuto dovrebbe essere valutata sulla base dei criteri adottati dall'Autore della scala per la scelta degli item e del loro contenuto al fine di esplorare compiutamente il problema specifico. In alcuni casi queste informazioni sono riportate nel manuale della scala o negli articoli in cui lo strumento viene presentato, il più delle volte, però, queste informazioni non sono disponibili e dobbiamo perciò ripiegare su di una valutazione empirica, soggettiva, basata sull'esame del contenuto della scala. Quando si tratta di giudicare la validità per contenuto di strumenti che misurano, ad esempio, capacità specifiche, come l'acquisizione di determinate nozioni (matematica, fisica, eccetera), il giudizio può essere relativamente facile, ma quando si tratta di RS che valutano sindromi cliniche, il giudizio è più difficile e complesso poiché gli item che la compongono possono misurare tanto un sintomo quanto una sindrome o sintomi che sono abbastanza caratteristici quando sono presenti, ma la cui presenza non è particolarmente frequente. È necessario perciò che gli item che compongono la scala esplorino sintomi che si manifestano con buona frequenza nel quadro clinico esplorato per poter dire che essi esprimono pienamente la sindrome che si intende esplorare e che, pertanto, la scala è valida.
Il problema, in psichiatria, è che, non esistendo un accordo unanime sulle diverse entità cliniche, è possibile descrivere la stessa sindrome usando termini e contenuti diversi e dando un peso relativo differente ai singoli aspetti. Tipico è, ad esempio, il caso della depressione per la valutazione della quale esistono numerose scale i cui item esplorano, come Faravelli (1983) ha ben documentato, aspetti sindromici diversi. Nasce allora il problema di che cosa realmente esplorino le RS, se la sindrome di per sé o la concezione che di quella sindrome hanno gli Autori delle diverse scale. Il problema non ha, ovviamente, soluzioni; generalmente si fa riferimento ad una RS assunta come standard e si calcola il coefficiente di correlazione fra questa e le altre scale impiegate nella stessa popolazione. Il grado di correlazione è tanto maggiore quanto più il coefficiente si avvicina all'unità e questo significa che l'ambito esplorato è abbastanza simile.
Dobbiamo anche ricordare che, quando l'entità che vogliamo valutare non è completamente definibile in base ad elementi osservabili e verificabili, come nel caso dei concetti psicodinamici, è praticamente impossibile avere una validità per contenuto, in quanto tali concetti sono esprimibili solo attraverso comportamenti che l'Autore presume collegati al concetto psicodinamico che egli vuole misurare; in questi casi si dovrà fare riferimento alla validità per costrutto (Faravelli, 1983).
Validità per criterio (o empirica)
La validità per criterio, detta anche validità empirica, si riferisce alla correlazione esistente tra lo strumento in esame ed altre variabili già considerate come misure affidabili. Questo tipo di approccio è più sofisticato rispetto alla validità per contenuto poiché presuppone la valutazione comparativa dello strumento con altre misure riconosciute come efficaci e con le quali ci si aspetta vi sia una correlazione. Il riscontro di questo tipo di validità consente di affermare che lo strumento in esame misura realmente ciò che si propone di misurare, anche se, come abbiamo detto, in psichiatria sono tutt'altro che comuni misure di confronto pienamente affidabili. Della validità per criterio fanno parte la validità concorrente, la validità predittiva e la validità di gruppo.
Validità concorrente
La validità concorrente indica la relazione che esiste fra i risultati forniti dalla RS ed uno o più criteri esterni (quali la diagnosi, il giudizio clinico, altre RS, eccetera), generalmente accettati come misure adeguate del fenomeno in esame, applicati contemporaneamente allo stesso paziente: così, ad esempio, un paziente con punteggio elevato alla Brief Psychiatric Rating Scale – BPRS, una scala di valutazione della psicopatologia generale, non dovrebbe avere un giudizio clinico di gravità "lieve" o "moderata". Generalmente il criterio esterno viene scelto ipotizzando che sia correlato con la RS.
Validità predittiva
La validità predittiva indica invece la capacità della scala di predire l'evoluzione del fenomeno che intende misurare. Poche sono le RS create per avere una validità predittiva e tra queste ricordiamo alcune scale prognostiche proposte per prevedere l'esito della schizofrenia. Il criterio della validità predittiva è molto importante per gli strumenti che mirano a individuare le specifiche capacità e competenze del soggetto ai fini della scelta di un corso di studio di una carriera professionale piuttosto che di un altra. In ambito clinico è difficile andare al di là di semplici indicazioni quali, ad esempio, un punteggio totale che indichi la necessità di instaurare un trattamento e, in alcuni casi, che il trattamento avrà probabilmente successo. Così, ad esempio, per molte RS è indicato il cosiddetto "cutoff point" (o score) che segna il limite fra la normalità e la patologia e che può essere usato come uno dei criteri per decidere se iniziare un trattamento. In altri casi, invece, il punteggio può essere usato come indice predittivo: nel caso di soggetti con disturbo d'ansia sottoposti a trattamento e valutati con una scala che esplora tanto l'ansia-tratto che l'ansia-stato, è prevedibile che, a parità di punteggio nell'ansia-stato, i pazienti con punteggi più elevati nell'ansia-tratto, vadano più facilmente incontro a ricadute. Il concetto su cui si basano tanto la validità concorrente che quella predittiva è analogo, essendo sempre un criterio esterno quello che definisce la bontà della scala, con la differenza che nella prima il criterio è contemporaneo, nella seconda è posposto nel tempo.
Validità di gruppo (o discriminante)
La validità di gruppo, detta anche validità discriminante, valuta i punteggi ottenuti, rispettivamente, in un gruppo che sappiamo avere un certo tipo di problemi ed in uno che sappiamo non averli, oppure in gruppi che sappiamo avere problemi di altro tipo. Così, ad esempio, i pazienti con problemi psichiatrici dovrebbero avere, in una RS psichiatrica, punteggi più elevati rispetto ai soggetti senza tali problemi; i pazienti con la stessa diagnosi dovrebbero avere, almeno nei sintomi nucleari, punteggi più elevati rispetto a pazienti con altra diagnosi; nell'ambito dello stesso quadro clinico, i pazienti in fase acuta dovrebbero avere punteggi maggiori rispetto a quelli in remissione; il singolo paziente dovrebbe avere punteggi diversi in rapporto a gradi diversi di gravità espressi in base al giudizio clinico; i pazienti che necessitano di ricovero dovrebbero avere punteggi maggiori rispetto a quelli che possono essere seguiti ambulatoriamente e così via.
Validità per costrutto
La validità per costrutto si applica allorché l'entità da valutare non è definibile interamente in base a concetti verificabili empiricamente e ci si deve riferire perciò ad un modello teorico del concetto esplorato. È un tipo di procedimento che trova applicazione soprattutto nelle scale che valutano concetti psicodinamici, che non possono esaurirsi in una serie definita di comportamenti verificabili come, ad esempio, i meccanismi di difesa, l'oralità, la solitudine, eccetera. La validità per costrutto deriva dalla verifica della validità concorrente (se cioè il nostro strumento correla significativamente con altre variabili esterne di rilievo) e di quella discriminante (se cioè variabili esterne irrilevanti e teoricamente senza alcun rapporto con il concetto che vogliamo misurare non correlano significativamente con il nostro strumento). La validità della scala sarà tanto maggiore quanto più saranno soddisfatte le ipotesi generate dal concetto di partenza e quante meno saranno le ipotesi non verificate dai fatti (Faravelli, 1983).
Validità fattoriale
La validità concorrente e discriminante possono essere verificate anche mediante l'analisi fattoriale (validità fattoriale): le variabili simili, infatti, correleranno tra loro in un unico fattore e quelle dissimili andranno a costituire fattori diversi. L'impiego di questa tecnica richiede che il campione analizzato sia abbastanza ampio, che vengano scelte, fra le numerose disponibili, le procedure di calcolo più adatte e che i valori impiegati per stabilire l'accettabilità o meno della fattorializzazione (i cosiddetti "eigenvalues") siano sufficientemente rigorosi da garantire che i fattori siano significativi. Un'altra tecnica statistica che può essere utilmente impiegata è l'analisi della regressione mediante la quale si può verificare il grado di correlazione di ciascun item con il punteggio totale della scala e con altre variabili che teoricamente non hanno con loro alcun rapporto: questa procedura ci dice se il nostro strumento correla con variabili attinenti e diverge da quelle non attinenti
Validità nominale
La validità nominale (o face validity) si riferisce alla reale corrispondenza fra gli item della scala e gli aspetti del quadro clinico che si intende valutare. Gli item della scala, in altri termini, devono esplorare effettivamente quelle manifestazioni che contribuiscono a definire i diversi aspetti dell'entità clinica che è oggetto del nostro interesse.