Come modellare dati continui non negativi a inflazione zero?


15

Attualmente sto cercando di applicare un modello lineare ( family = gaussian) a un indicatore di biodiversità che non può assumere valori inferiori a zero, è gonfiato a zero ed è continuo. I valori vanno da 0 a poco più di 0,25. Di conseguenza, esiste un modello abbastanza evidente nei residui del modello di cui non sono riuscito a liberarmi: inserisci qui la descrizione dell'immagine

Qualcuno ha qualche idea su come risolverlo?


1
Benvenuti in CV! Nota che il tuo nome utente, identicon e un link alla tua pagina utente vengono aggiunti automaticamente a ogni post che pubblichi, quindi non è necessario firmare i tuoi post. In effetti, preferiamo che tu non lo faccia.
Silverfish,

3
Se è gonfiato a zero non può essere continuo, poiché le variabili continue non possono avere salti nel cdf (e ce n'è chiaramente uno a 0). Può essere continuo a parte gli 0.
Glen_b -Restate Monica

Risposte:


32

Esistono una varietà di soluzioni nel caso di distribuzioni continue (semi) non gonfiate:

  • Regressione di Tobia : presuppone che i dati provengano da una singola distribuzione normale sottostante, ma che i valori negativi vengano censurati e impilati su zero (ad es . Pacchetto censReg )
  • ostacolo o modello "a due stadi": utilizzare un modello binomiale per prevedere se i valori sono 0 o> 0, quindi utilizzare un modello lineare (o Gamma, o normale troncato o log-normale) per modellare i valori diversi da zero osservati
  • 1<p<2X>0

Oppure, se la tua struttura dati è abbastanza semplice, potresti semplicemente usare modelli lineari e usare test di permutazione o qualche altro approccio robusto per assicurarti che la tua inferenza non sia incasinata dall'interessante distribuzione dei dati.

Ci sono pacchetti / soluzioni R disponibili per la maggior parte di questi casi.

Ci sono altre domande su SE riguardo ai dati (semi) continui a zero (ad es. Qui , qui e qui ), ma non sembrano offrire una risposta generale chiara ...

Vedi anche Min & Agresti, 2002, Modellazione di dati non negativi con aggregazione a zero: un'indagine per una panoramica.


@Ben Bolker "Utilizzeresti un modello lineare (o Gamma, o normale troncato o log-normale) per modellare i" valori diversi da zero previsti o effettivi?
rolando2,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.