Anche se mancano ancora alcune informazioni (n. Individui e articoli per sottoscala), ecco alcuni suggerimenti generali sulla riduzione della scala. Inoltre, dal momento che stai lavorando a livello di questionario, non vedo perché la sua lunghezza sia così importante (dopotutto, fornirai solo statistiche riassuntive, come punteggi totali o medi).
Presumo che (a) hai una serie di oggetti K che misurano un costrutto correlato al morale, (b) la tua scala "unidimensionale" è un fattore di secondo ordine che potrebbe essere suddiviso in diverse sfaccettature, (c) che vorresti riduci la scala a k <K articoli in modo da riassumere con sufficiente precisione i punteggi della scala totale dei soggetti preservando la validità del contenuto della scala.
Validità del contenuto / costrutto di questa scala validata: il numero di elementi è stato sicuramente scelto in modo da riflettere meglio il costrutto di interesse. Abbreviando il questionario, si sta effettivamente riducendo la copertura del costrutto. Sarebbe bene verificare che la struttura del fattore rimanga la stessa quando si considera solo la metà degli elementi (il che potrebbe anche influire sul modo in cui li si seleziona, dopo tutto). Questo può essere fatto usando le tradizionali tecniche FA. Hai la responsabilità di interpretare la scala in uno spirito simile a quello degli autori.
Informazioni sull'affidabilità dei punteggi : sebbene si tratti di una misura dipendente dal campione, l'affidabilità dei punteggi diminuisce quando si riduce il numero di elementi (vedere la formula di Spearman-Brown ); un altro modo di vedere è che l'errore standard di misurazione (SEM) aumenterà, ma vedi Un modulo didattico NCME sull'errore standard di misurazione , di Leo M Harvill. Inutile dire che si applica a tutti gli indicatori che dipendono dal numero di elementi (ad esempio, l'alfa di Cronbach che può essere utilizzata per stimare una forma di affidabilità, vale a dire la coerenza interna). Si spera che ciò non abbia alcun impatto su confronti tra gruppi basati su punteggi grezzi.
Quindi, i miei consigli (il modo più semplice) sarebbero:
- Seleziona i tuoi articoli in modo da massimizzare la copertura del costrutto; verificare la dimensionalità con FA e la copertura con distribuzioni di risposte univariate;
- Confrontare le correlazioni interitem medie con quelle precedentemente riportate;
- Calcola la coerenza interna per il fondo scala e i compositi; verificare che siano in accordo con le statistiche pubblicate sulla scala originale (non è necessario testare nulla, si tratta di misure dipendenti dal campione);
- Prova le correlazioni lineari (o policicoriche o di rango) tra punteggi originali e (sub) ridotti, per assicurarti che siano comparabili (cioè che le posizioni individuali sul tratto latente non variano in larga misura, come obiettato attraverso i punteggi grezzi );
- Se si dispone di una variabile esterna specifica del soggetto (ad es. Sesso, età o meglio una misura correlata al morale), confrontare la validità del gruppo noto tra le due forme.
Il modo più difficile sarebbe fare affidamento sulla teoria della risposta degli oggetti per selezionare quegli oggetti che contengono il massimo di informazioni sulla caratteristica latente: la riduzione della scala dei tratti è in realtà una delle sue migliori applicazioni. I modelli per articoli politomici sono stati parzialmente descritti in questo thread, Convalida dei questionari .
Aggiorna dopo il tuo secondo aggiornamento
- Dimentica qualsiasi modello IRT per oggetti politomici con così pochi soggetti.
- L'analisi fattoriale soffrirà anche di una dimensione del campione così bassa; otterrai stime di caricamento dei fattori inaffidabili.
- 30 articoli divisi per 2 = 15 articoli (è facile farsi un'idea dell'aumento del SEM corrispondente per il punteggio totale), ma peggiorerà definitivamente se si considerano le sottoscale (questa era in realtà la mia seconda domanda - No. per sottoscala, se presente)