Presumo che il tuo questionario debba essere considerato come una scala unidimensionale (altrimenti l'alfa di Cronbach non ha molto senso). Vale la pena eseguire un'analisi fattoriale esplorativa per verificarlo. Ti permetterà anche di vedere come gli articoli si collegano alla bilancia (cioè, attraverso i loro caricamenti).
I passaggi di base per la convalida degli articoli e della bilancia dovrebbero includere:
- una relazione completa sulle statistiche di base delle voci (intervallo, quartili, tendenza centrale, effetti del soffitto e del pavimento, se presenti);
- verifica la coerenza interna come hai fatto con la tua alfa (meglio, dai intervalli di confidenza al 95%, perché dipende dal campione);
- descrivi la tua misura sommaria (ad es. punteggio totale o medio, ovvero punteggio della scala) con le statistiche usuali (istogramma + densità, quantili ecc.);
- controlla le tue risposte riepilogative contro covariate specifiche che si presume siano correlate al costrutto che stai valutando - questo è indicato come validità del gruppo noto;
- se possibile, controlla le tue risposte sommarie contro strumenti noti che pretendono di misurare lo stesso costrutto ( validità concorrente o convergente).
Se la tua scala non è unidimensionale, questi passaggi devono essere eseguiti per ogni sottoscala e potresti anche fattorizzare la matrice di correlazione dei tuoi fattori per valutare la struttura del fattore di secondo ordine (o utilizzare la modellazione di equazioni strutturali o l'analisi dei fattori di conferma, o tutto quello che vuoi). È inoltre possibile valutare la validità convergente e discriminante utilizzando il ridimensionamento multi-tratto o la modellazione multi-metodo multi-tratto (basata sulle correlazioni inter-interem all'interno e tra le scale) o, ancora, i SEM.
Quindi, direi che la teoria della risposta agli articoli non sarebbe di grande aiuto se non sei interessato ad abbreviare il tuo questionario, filtrare alcuni articoli che mostrano il funzionamento degli articoli differenziali o utilizzare il tuo test in una sorta di test adattativo al computer .
In ogni caso, il modello Rasch è per oggetti binari. Per gli articoli polittomici ordinati, i modelli più comunemente usati sono:
- il modello di risposta graduata
- il modello di credito parziale
- il modello della scala di valutazione.
Solo gli ultimi due appartengono alla famiglia Rasch e fondamentalmente usano una formulazione di probabilità adiacente, con l'idea che il soggetto debba "superare" diverse soglie per approvare una determinata categoria di risposta. La differenza tra questi due modelli è che il PCM non impone che le soglie siano equamente distanziate sulla scala theta ( abilità o posizione del soggetto sulla caratteristica latente). Il modello di risposta graduata si basa su una formulazione di probabilità cumulativa. Essere consapevoli del fatto che tutti questi modelli suppongono che la scala sia unidimensionale; cioè, c'è solo un tratto latente. Ci sono ipotesi aggiuntive come, ad esempio, l'indipendenza locale (ovvero, le correlazioni tra le risposte sono spiegate da variazioni nella scala delle abilità).
In ogni caso, si trova una documentazione molto completa e indizi utili per applicare metodi psicometrici in R del volume 20 del Journal of Software statistici: Volume Speciale: Psicometria in R . Fondamentalmente, i pacchetti R più interessanti che utilizzo nel mio lavoro quotidiano sono: ltm , eRm , psych , psy . Altri vengono indicati nella vista attività CRAN Psicometria . Altre risorse di interesse sono:
Una buona recensione sull'uso di FA vs. IRT nello sviluppo della scala si trova nella costruzione e valutazione della scala in pratica: una revisione dell'analisi fattoriale rispetto alle applicazioni della teoria della risposta degli oggetti , di ten Holt et al (Psychological Test and Assessment Modeling (2010) 52 (3): 272-297).