Una sesta opzione di risposta ("Non lo so") è stata aggiunta a una scala Likert a 5 punti. I dati sono persi?


16

Ho bisogno di un po 'di aiuto per recuperare i dati da un questionario.

Uno dei miei colleghi ha applicato un questionario, ma inavvertitamente, invece di utilizzare la scala Likert a 5 punti originale (in forte disaccordo per essere fortemente d'accordo), ha inserito una sesta risposta nella scala. E, a peggiorare la questione, la sesta opzione di risposta è ... "Non lo so".

Il problema è la grande percentuale di intervistati che, in un punto o nell'altro, hanno scelto "Non lo so". Se fossero una percentuale ragionevolmente piccola, li avrei appena esclusi dal database. Tuttavia, il nucleo della ricerca si basa su un modello concettuale, ed escludere così tanti record creerebbe un problema per il modello.

Qualcuno potrebbe indicarmi la giusta direzione qui? Esistono "buone pratiche" o posso fare qualcosa per utilizzare (trasformare, convertire, ecc.) Quelle risposte "Non lo so"?

Inoltre, se faccio qualsiasi manipolazione dei dati in questione (ad esempio, se converto le risposte "Non so", per sostituzione, imputazione, ecc.), Che tipo di "disclaimer", "avviso", annotazione, dovrei usare?

So che è un tiro lungo, ma confesso, oltre a salvare le risposte, sono anche curioso di sapere quale sia la pratica concordata (se ce n'è una), in questo tipo di casi.

PS: So che sembra infantile, ma no, il "collega" non sono io :)


22
Immagina che il tuo collega non abbia incluso la categoria Non lo so. Cosa avrebbero risposto quelle persone? Forse avrebbero spuntato una categoria casuale, forse l'avrebbero lasciato in bianco. Ora sai che le tue variabili sono problematiche e prendono una decisione informata. Visto da questa prospettiva, il collega ti ha fatto un favore.
Maarten Buis,

Beh, per quanto riguarda grattarmi la testa, mi ha davvero fatto un favore ... Hai ragione sulla casualità delle risposte, e questo potrebbe essere un approccio per l'imputazione, tuttavia, mi chiedevo se ci fosse qualcosa di buono pratiche, o almeno alcune esperienze simili
semplificare il

4
Trovo che i questionari che non hanno tale opzione " Non lo so " siano particolarmente frustranti (specialmente quando non è possibile inviare senza scegliere qualcosa). Diciamo solo che fai una domanda del tipo " Le nuove funzionalità di quel razzo spaziale sono un miglioramento ", e poi sei costretto a essere neutrale nella migliore delle ipotesi, alcune persone possono quindi interpretare quel tipo di sondaggi e concludere "Abbiamo chiesto a 1000 persone, e al 100% non importava ... ", mentre in pratica quella caratteristica potrebbe essere un errore completo per coloro che la usano. In quei casi, sembra quasi un'approvazione silenziosa per qualcosa che non ho usato.
Bruno,

3
Per essere più chiari: se il modello presuppone che la scala a 5 punti possa rappresentare le opinioni degli intervistati, i dati dimostrano che il modello è inadeguato . Se fosse corretto, allora avresti un numero trascurabile di "Non lo so", perché le persone sarebbero state in grado di rispondere 1-5. Quindi questi dati "creerebbero un problema per il modello" come l'orbita di Mercurio crea un problema per la fisica newtoniana. Avrei pensato che la tua unica via d'uscita fosse se il punto centrale non fosse "né d'accordo né in disaccordo" e si può sostenere che "Non lo so" è ridondante con lo stesso significato di questo.
Steve Jessop,

Ciao, @SteveJessop, mentre in teoria / in linea di principio, hai ragione sul numero di risposte DK come indicative di un problema con il questionario (non il modello, intendiamoci, il modello non è CFA per la scala, ma la regressione per un mucchio di variabili, inclusa la scala), è ancora un po 'forte chiamarlo inadeguato. Farò le analisi di scala e vedrò, ed è vero, il numero di taglio delle risposte DK potrebbe rivelarsi problematico. Tuttavia, possono anche significare che l'intervistato non ha avuto voglia di rispondere (per inciso, la stragrande maggioranza delle risposte DK proviene da un gruppo di studenti dopo un esame ...)
semplifica il

Risposte:


28

Perché provare a forzare una calibrazione su qualcosa che non è vero? Come ha detto Maarten, questa non è una perdita di dati ma un guadagno di informazioni. Se la pillola magica che stai cercando esiste, significherebbe che ci sono alcune ipotesi sulla tua popolazione che sono fatte, ad esempio, una propensione a favore di una particolare etichetta anche se gli utenti dicono "Non lo so".

Capisco perfettamente la tua frustrazione, ma il modo corretto di affrontare il problema è quello di modificare il modello per adattarlo alle tue esigenze in base ai dati realmente esistenti e non viceversa (modifica dei dati).


Ciao Hatim, non credo sia possibile modificare il modello. La scala è ordinale e assume una scelta ragionata ed esplicita, mentre la sesta risposta, "non lo so", può essere interpretata in vari modi. Può significare che "non ho mai incontrato questa situazione / non ricordo", potrebbe rappresentare una scelta "intermedia" di qualche tipo. Qualsiasi interpretazione / assunzione di questo tipo da parte mia sarebbe presuntuosa e infondata. La risposta di Maarten si riferiva a un "guadagno" di informazioni, secondo cui si può usare una specifica imputazione "randomizzata", ma questo non è ciò che dici: "modifica il modello".
semplificare il

continuazione ... Tuttavia, anche se ero e sono ancora tentato di esaminare ulteriormente tale imputazione "randomizzata", l'ampio volume di risposte "non lo so" mi fa temere che le vere (autentiche) relazioni tra variabili saranno alterato.
semplificare il

8
+1. So che è scomodo, ma tu [l'OP] hai la possibilità di scegliere un set di dati diverso se vuoi testare quel modello o modificare l'analisi pianificata. Hai posto la domanda sperando in risposte diverse ma, a mio avviso, non ce ne sono che siano difendibili. Se rispondessi a un simile questionario, mi sentirei offeso dalla distorsione e dalla mancanza di fiducia nel tentativo di trattare il mio non so come qualsiasi altra cosa. In effetti, come consumatore occasionale di ricerca sociale, sono anche sconcertato.
Nick Cox,

1
Hai naturalmente ragione che questo è successo prima e molte volte. Ecco perché quelli con una certa esperienza in progetti deviati o complicati da problemi imprevisti possono dire, quindi l'analisi sarà diversa e il lavoro non sarà come immaginato. O addirittura, a volte i progetti non funzionano, quindi ecco qua. (Se in qualche modo sei sotto istruzione o costrizione a seguire, questo è particolarmente sfortunato, ma non influisce sul mio consiglio su come pensarci.)
Nick Cox,

8
@utente2836366 Non capisco le tue affermazioni secondo cui il modello non può essere modificato. Certamente "Non lo so" non fa parte della raccolta ordinale di risposte, ma è del tutto pertinente; "Non lo so" implica che per qualunque motivo (incluso lo sappia effettivamente) la persona non ha scelto una delle risposte ordinali. Quindi una di queste modifiche è che potresti avere un modello per quel processo (scegli "non so" vs "scegli una delle altre opzioni") e poi il solito modello per i casi nella seconda categoria. Tali modelli possono essere in qualche modo simili ai modelli di ostacolo o ai modelli a gonfiaggio zero.
Glen_b

10

Se si trattava di un questionario standardizzato che è stato validato in modo indipendente, non è possibile affermare che il nuovo questionario è equivalente e che i dati non sono più comparabili. Potresti provare a convalidare ed esaminare il questionario in esperimenti separati (che richiedono molto tempo e fatica, specialmente se vuoi anche mostrare la comparabilità con la vecchia versione) o semplicemente accettare che stai trattando una qualità di prova inferiore (poiché i tuoi dati vengono da un questionario non validato).

Quando utilizzi i tuoi dati, dovrai prendere in considerazione la modifica. Di fronte a una domanda sull'atteggiamento, le persone non ti danno in qualche modo una risposta "oggettivamente vera", ti danno la risposta che ritengono vera - e questo è certamente influenzato da entrambe le opzioni di risposta disponibili ("normano" le loro risposte alla scala) e alla conoscenza che hanno sull'argomento (ci sono pregiudizi noti che funzionano in modo diverso, a volte in direzioni diverse (!) a seconda che il partecipante abbia molta o poca conoscenza sull'argomento).

Quindi, se abbiamo a che fare con un quesitonnaire affermato, hai la bella opzione per un confronto tra la tua versione del questionario e quella originale. Se l'originale supponeva che le persone sapessero cosa stavano selezionando e si scopre che non lo fanno, puoi discutere di come il vecchio modello si basa su ipotesi errate e quali sono le conseguenze di ciò. Nota che questa è una scoperta "laterale", che fa una bella nuova domanda di ricerca, ma ti allontana da quello originale, e in effetti mostra che rispondere a quello originale è molto più difficile di quanto si pensi, quindi moltiplica il tuo lavoro.

Se non hai a che fare con un questionario stabilito, puoi seguire il flusso e far finta che il tuo questionario ad hoc sia stato pianificato in quel modo e valutare i risultati di conseguenza. Ancora una volta, potrebbe significare che i risultati sperati non sono ottenibili con questo metodo, ma anche questa è una cosa importante da sapere.

Per una buona comprensione di come la formulazione e le opzioni influenzano il modo in cui i questionari ricevono risposta, suggerisco di leggere la "Psicologia della risposta al sondaggio" di Tourangeau et al. È un'ottima lettura per chiunque abbia mai creato un questionario.


2

Se chiedi a quanti bambini ha dato alla luce l'intervistato, le risposte "zero" e "non applicabile" non significherebbero strettamente la stessa cosa, dal momento che gli uomini non possono partorire.

Per alcuni contesti, equiparare "Non so" alla risposta neutra potrebbe essere, allo stesso modo, un errore concettuale.

In realtà, hai due domande: un dicotomico "Hai un'opinione?" e un ordinale "Che cos'è?", proprio come, sopra, hai un implicito "Sei una femmina?" oltre la tua domanda esplicita.

Certo, puoi introdurre alcune ipotesi (a volte correttamente, a volte solo per comodità, a volte forzatamente) per consentirti di modellare, ma non riesco a vedere alcuna strategia universalmente applicabile senza entrare nel regno dei dettagli del tuo fenomeno.

Come ultimo punto a cui pensare, non avrebbe senso cercare di dedurre dalla popolazione maschile qualcosa dalle risposte sulla fecondità femminile.


2

Il dilemma se si dovrebbe includere o meno l'opzione Non so response in un questionario costituito da scale di valutazione di tipo Likert è eterno. Spesso, quando gli articoli chiedono un'opinione, il DK è incluso perché non avere un'opinione è uno stato importante da solo e l'opzione in quanto tale è attesa dai rispondenti. Negli inventari dei tratti personali in cui le persone attribuiscono qualità a un'opzione DK target, in genere viene eliminata perché un intervistato normalmente dovrebbe essere in grado di valutare l'entità dell'affinità di una caratteristica (ovvero il rispondente viene sempre considerato qualificato); e quando trova occasionalmente difficoltà gli è permesso (per istruzione) di saltare quell'oggetto. Negli inventari dei tratti personali in cui le persone descrivono un target (oggetti comportamentali) DK (o don '

@Hatim nella sua risposta, @Maarten e alcuni altri commentatori della domanda del PO hanno ragionevolmente sostenuto che una grande quantità di risposte DK osservate nel presente studio indicano problemi (validità del contenuto o validità del viso) negli articoli o che i soggetti non si adatta al questionario ordinato loro.

Ma non puoi mai raccontare la storia, in definitiva l'interpretazione dell'impedimento è su di te (a meno che non la affronti in un'indagine separata). Si potrebbe affermare, ad esempio, che l'inclusione dell'opzione DK tra i probabili in quel questionario (diciamo, è un inventario di attribuzione del tratto) serve male, non bene. Non ti ha dato informazioni (di cui dicono i commentatori it proves that the [rating] model is inadequate), ma piuttosto ha distratto / sedotto un intervistato. Se non fosse stata fornita, la decisione di valutazione guidata dallo schema implicito del tratto cognitivo avrebbe potuto essere evocata; ma vedere l'opzione di raffreddamento preclude lo schema e si affretta a ritirarsi.

Se lo ammetti ulteriormente - a tuo rischio, ma perché no? - che un soggetto facilmente distratto o pigro è quello il cui potenziale, la visione trattenuta è valida ma tende a essere debolmente differenziata - cioè, invocherebbe facilmente il convenzionale das Man , al posto di Erlebnis personale , schema - quindi potresti ipotizzare provvisoriamente che la sua risposta mancante è intorno alla media del campione o della popolazione per quell'elemento. In tal caso, perché non significhi (+ rumore) la sostituzione delle risposte mancanti? Oppure potresti fare un'imputazione EM o regressiva (+ rumore) per tenere conto delle correlazioni.

Ripetere: la decisione di imputazione è possibile ma rischiosa ed è improbabile, data la grande quantità di dati mancanti, ripristinare "veramente" i dati assenti. Come diceva @rumtscho, sicuramente il nuovo questionario con DK non è equivalente a quello originale senza DK e i dati non sono più comparabili.

Queste erano speculazioni. Ma prima di tutto, dovresti tentare di indagare sui modelli osservati di mancanza. Chi sono quei soggetti che hanno selezionato DK? Si raggruppano in sottotipi? In che modo differiscono sul resto degli articoli dal sottocampione "okay"? Alcuni software hanno un pacchetto di analisi del valore mancante. Quindi potresti decidere se eliminare le persone in tutto o in parte, oppure imputarle o analizzarle come sottocampione separato.

PS Si noti inoltre che gli intervistati sono "stupidi". Spesso si confondono con i gradi della scala. Ad esempio, se il punto DK fosse posizionato vicino a un polo della scala, verrebbe spesso confuso dalla disattenzione con quel polo. Non sto scherzando.


Ciao, @ttnphns, Beh, la tua risposta è troppo lunga per prenderla punto per punto (ho già commentato le altre risposte su alcuni dei punti che hai sollevato qui). Ad essere sincero, dovrò rileggerlo un paio di volte. Tuttavia, si rivolge a tutto ciò che volevo.
semplificare il

0

Ora hai intervistati auto-selezionati per avere un'opinione in merito. Qualunque cosa tu concluda riguarderà esclusivamente quelle persone. Questo potrebbe essere OK, dato che il polling di "non lo so" è per definizione meno utile.


2
Droll, ma troppo pessimista. Quelle persone hanno offerto argomenti su ciò che si può, non si può, non si dovrebbe fare, e sono gli argomenti che dovrebbero essere soppesati. La stessa risposta potrebbe essere data su qualsiasi thread qui, ma quelli che non parlano non hanno voce in capitolo.
Nick Cox,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.