Ho una domanda sulla corretta distribuzione da utilizzare per la creazione di un modello con i miei dati. Ho condotto un inventario forestale con 50 trame, ogni trama misura 20m × 50m. Per ogni trama, ho stimato la percentuale di chioma d'albero che ombreggia il terreno. Ogni trama ha un valore, in percentuale, per la copertura del baldacchino. Le percentuali vanno da 0 a 0,95. Sto realizzando un modello di copertura del baldacchino ad albero percentuale ( variabile Y ), con una matrice di variabili X indipendenti basata su immagini satellitari e dati ambientali.
Non sono sicuro che dovrei usare una distribuzione binomiale, poiché una variabile casuale binomiale è la somma di n prove indipendenti (cioè, variabili casuali di Bernoulli). I valori percentuali non sono la somma delle prove; sono le percentuali effettive. Dovrei usare la gamma, anche se non ha un limite superiore? Devo convertire le percentuali in numeri interi e usare Poisson come conteggi? Dovrei semplicemente restare con Gaussian? Non ho trovato molti esempi in letteratura o nei libri di testo che provano a modellare le percentuali in questo modo. Eventuali suggerimenti o approfondimenti sono apprezzati.
Grazie per le tue risposte. Infatti, la distribuzione beta è esattamente ciò di cui ho bisogno ed è discussa a fondo in questo articolo:
Eskelson, BN, Madsen, L., Hagar, JC e Temesgen, H. (2011). Stima della copertura vegetativa minimale di Riparian con regressione beta e modelli di copula. Forest Science, 57 (3), 212-221.
Questi autori usano il pacchetto betareg in R di Cribari-Neto e Zeileis.
L'articolo che segue illustra un buon modo per trasformare una variabile di risposta distribuita in beta quando include 0 e / o 1 reali nell'intervallo di percentuali:
- Smithson, M. e J. Verkuilen, 2006. Un migliore spremi limone? Regressione massima verosimiglianza con variabili dipendenti beta-distribuite , Metodi psicologici, 11 (1): 54–71.