Come gestire l'effetto soffitto grazie allo strumento di misurazione?


12

Ho raccolto dati psicofisiologici che misurano la capacità dei soggetti (due gruppi) di percepire le vibrazioni. Una sonda vibrante si muove contro la pelle a spostamenti sempre più piccoli e il soggetto indica quando sentono la vibrazione. Sfortunatamente, alle alte frequenze, la sonda può spostarsi solo di una breve distanza, e talvolta la distanza maggiore che la sonda può percorrere non è ancora abbastanza grande per essere percepita dai soggetti. Quindi, ho valori di soglia precisi per alcuni soggetti, ma per alcuni che non hanno mai sentito la vibrazione, ho semplicemente un valore che so che la loro soglia è maggiore di. C'è un modo per me di includere ancora questi dati? E qual è il modo migliore per analizzarlo?


5
Queste sono chiamate osservazioni censurate . Come includerlo dipende dal tipo di analisi statistica che stai conducendo.

Sono d'accordo con Procrastinator, tranne per il fatto che avrei usato il termine troncato. L'approccio a un problema simlar chiamato censura corretta si verifica nell'analisi di sopravvivenza in cui si mantiene il valore troncato ma si dispone di una variabile indicatore che indica se il valore è un valore completo o censurato. Nell'analisi di sopravvivenza c'è un modo semplice per affrontarlo, ma è perché stai stimando una curva di sopravvivenza. Qui potresti voler calcolare le medie. Se ignori la motivazione, sottovaluti la media. Se elimini i punti troncati, sottovaluti la media.
Michael R. Chernick,

Per incorporare correttamente i valori troncati è necessario disporre di un modello di probabilità per la distanza della sonda dato che è maggiore della soglia. È quindi possibile prendere la media di tale distribuzione e calcolare una media ponderata utilizzando la media per i valori che non sono stati troncati con la media per la distribuzione troncata in cui la ponderazione è in base alla percentuale di casi troncati.
Michael R. Chernick,

4
Il troncamento è ciò che accadrebbe se si eliminassero i dati non quantificati. Non vuoi farlo! Hai ragione, Cale, che ci sono informazioni in questi valori censurati e nel sospettare che ci siano alcuni modi standard per analizzarli (e insidie ​​per gli incauti). Ma per fornire una buona risposta dovremmo sapere che tipo di analisi cerchi. In particolare, il trattamento di questi dati è sostanzialmente diverso a seconda che compaiano come variabili dipendenti o indipendenti in una regressione. Forse potresti approfondire questo?
whuber

1
Piccoli dettagli non correlati alla domanda statistica a portata di mano, ma potrebbe essere utile sapere: dati di questo tipo sono generalmente chiamati dati "psicofisici", non "psicofisiologici" (che includono cose come la frequenza cardiaca o le misure di conduttanza della pelle ma non giudizi soggettivi sulle sensazioni ). Questo potrebbe anche aiutarti a cercare documentazione su come le persone trattano normalmente questo tipo di dati.
Gala,

Risposte:


2

Mi piace usare modelli di miscele eterogenei per descrivere effetti combinati da fonti fondamentalmente diverse.

Potresti guardare qualcosa come un modello "Zero Inflated Poisson" nello stile di Diane Lambert. " Regressione di Poisson a inflazione zero, con un'applicazione ai difetti di produzione ", Diane Lambert, Technometrics, vol. 34, Iss. 1, 1992

Trovo questa idea particolarmente deliziosa perché sembra contraddire l'idea che l'applicazione del disegno statistico degli esperimenti alla medicina non possa curare completamente la malattia. Dietro l'idea è che il metodo scientifico non può completare il suo scopo in medicina deriva dall'idea che non ci sono dati sulla malattia da un individuo "perfettamente" sano e quindi che i dati non possono informare il rimedio della malattia. Senza misurazione non c'è spazio per migliorare.

L'uso di qualcosa come un modello a zero zero consente di estrarre informazioni utili da dati parzialmente "privi di errori". Sta usando la comprensione del processo per prendere le informazioni che potrebbero essere considerate "silenziose" e farle parlare. Per me questo è il tipo di cosa che stai cercando di fare.

Ora non posso iniziare ad affermare quali combinazioni di modelli usare. Ho il sospetto che potresti usare un modello di miscela gaussiana gonfiato a zero (GMM) per cominciare. GMM è un po 'un approssimatore universale empirico per PDF continui, come il cugino PDF dell'approssimazione della serie di Fourier, ma con il supporto del teorema del limite centrale per migliorare l'applicabilità globale e consentire in genere molti meno componenti per creare un " buona "approssimazione.

Buona fortuna.

MODIFICARE:

Altro su modelli a gonfiaggio zero:


0

Raggruppare i risultati e definire una scala potrebbe essere una soluzione.

Crea una variabile di categoria in questo modo (o in modo diverso):

  1. Alta sensibilità
  2. Sensibilità normale
  3. Bassa sensibilità
  4. Insensibile (quelli fuori scala nel tuo caso)

È possibile utilizzare questa variabile per eseguire l'analisi, ma se i risultati sono significativi dipende da quanto bene si definiscono le categorie.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.