Il dilemma se si dovrebbe includere o meno l'opzione Non so response in un questionario costituito da scale di valutazione di tipo Likert è eterno. Spesso, quando gli articoli chiedono un'opinione, il DK è incluso perché non avere un'opinione è uno stato importante da solo e l'opzione in quanto tale è attesa dai rispondenti. Negli inventari dei tratti personali in cui le persone attribuiscono qualità a un'opzione DK target, in genere viene eliminata perché un intervistato normalmente dovrebbe essere in grado di valutare l'entità dell'affinità di una caratteristica (ovvero il rispondente viene sempre considerato qualificato); e quando trova occasionalmente difficoltà gli è permesso (per istruzione) di saltare quell'oggetto. Negli inventari dei tratti personali in cui le persone descrivono un target (oggetti comportamentali) DK (o don '
@Hatim nella sua risposta, @Maarten e alcuni altri commentatori della domanda del PO hanno ragionevolmente sostenuto che una grande quantità di risposte DK osservate nel presente studio indicano problemi (validità del contenuto o validità del viso) negli articoli o che i soggetti non si adatta al questionario ordinato loro.
Ma non puoi mai raccontare la storia, in definitiva l'interpretazione dell'impedimento è su di te (a meno che non la affronti in un'indagine separata). Si potrebbe affermare, ad esempio, che l'inclusione dell'opzione DK tra i probabili in quel questionario (diciamo, è un inventario di attribuzione del tratto) serve male, non bene. Non ti ha dato informazioni (di cui dicono i commentatori it proves that the [rating] model is inadequate
), ma piuttosto ha distratto / sedotto un intervistato. Se non fosse stata fornita, la decisione di valutazione guidata dallo schema implicito del tratto cognitivo avrebbe potuto essere evocata; ma vedere l'opzione di raffreddamento preclude lo schema e si affretta a ritirarsi.
Se lo ammetti ulteriormente - a tuo rischio, ma perché no? - che un soggetto facilmente distratto o pigro è quello il cui potenziale, la visione trattenuta è valida ma tende a essere debolmente differenziata - cioè, invocherebbe facilmente il convenzionale das Man , al posto di Erlebnis personale , schema - quindi potresti ipotizzare provvisoriamente che la sua risposta mancante è intorno alla media del campione o della popolazione per quell'elemento. In tal caso, perché non significhi (+ rumore) la sostituzione delle risposte mancanti? Oppure potresti fare un'imputazione EM o regressiva (+ rumore) per tenere conto delle correlazioni.
Ripetere: la decisione di imputazione è possibile ma rischiosa ed è improbabile, data la grande quantità di dati mancanti, ripristinare "veramente" i dati assenti. Come diceva @rumtscho, sicuramente il nuovo questionario con DK non è equivalente a quello originale senza DK e i dati non sono più comparabili.
Queste erano speculazioni. Ma prima di tutto, dovresti tentare di indagare sui modelli osservati di mancanza. Chi sono quei soggetti che hanno selezionato DK? Si raggruppano in sottotipi? In che modo differiscono sul resto degli articoli dal sottocampione "okay"? Alcuni software hanno un pacchetto di analisi del valore mancante. Quindi potresti decidere se eliminare le persone in tutto o in parte, oppure imputarle o analizzarle come sottocampione separato.
PS Si noti inoltre che gli intervistati sono "stupidi". Spesso si confondono con i gradi della scala. Ad esempio, se il punto DK fosse posizionato vicino a un polo della scala, verrebbe spesso confuso dalla disattenzione con quel polo. Non sto scherzando.