Si consiglia spesso di prendere la radice quadrata quando si hanno i dati di conteggio. (Per alcuni esempi su CV, vedi la risposta di @ HarveyMotulsky qui , o la risposta di @ whuber qui .) D'altra parte, quando si adatta un modello lineare generalizzato con una variabile di risposta …
Comprendo che per determinati set di dati come il voto funziona meglio. Perché la regressione di Poisson viene utilizzata sulla normale regressione lineare o regressione logistica? Qual è la motivazione matematica per questo?
Sto convalidando in modo incrociato un modello che sta cercando di prevedere un conteggio. Se questo fosse un problema di classificazione binaria, calcolerei l'AUC out-fold e se questo fosse un problema di regressione calcolerei RMSE o MAE out-of-fold. Per un modello di Poisson, quali parametri di errore posso usare per …
Considera un modello di ostacolo che prevede i dati di conteggio yda un normale predittore x: set.seed(1839) # simulate poisson with many zeros x <- rnorm(100) e <- rnorm(100) y <- rpois(100, exp(-1.5 + x + e)) # how many zeroes? table(y == 0) FALSE TRUE 31 69 In questo …
Attualmente sto lottando per trovare il modello giusto per dati di conteggio difficili (variabile dipendente). Ho provato vari modelli diversi (i modelli di effetti misti sono necessari per il mio tipo di dati) come lmere lme4(con una trasformazione logaritmica) nonché modelli di effetti misti lineari generalizzati con varie famiglie come …
La distribuzione binomiale negativa (NB) è definita su numeri interi non negativi e ha la funzione di massa di probabilitàHa senso considerare una distribuzione continua su reali non negativi definiti dalla stessa formula (sostituendo con x \ in \ mathbb R _ {\ ge 0} )? Il coefficiente binomiale può …
Ho 17 anni (1995-2011) di dati relativi al certificato di morte relativi a decessi suicidi per uno stato negli Stati Uniti. C'è molta mitologia là fuori sui suicidi e sui mesi / stagioni, molti dei quali contraddittori, e della letteratura I ' ho rivisto, non ho un chiaro senso dei …
Di recente ho iniziato a lavorare in una clinica per la tubercolosi. Ci incontriamo periodicamente per discutere il numero di casi di tubercolosi che stiamo attualmente trattando, il numero di test somministrati, ecc. Vorrei iniziare a modellare questi conteggi in modo da non indovinare solo se qualcosa di insolito o …
Sto cercando di impaginare da solo quando è appropriato usare quale tipo di regressione (geometrico, Poisson, binomiale negativo) con i dati di conteggio, all'interno del framework GLM (solo 3 delle 8 distribuzioni GLM sono usate per i dati di conteggio, sebbene la maggior parte di ciò che Ho letto i …
Ho quello che pensavo ingenuamente di essere un problema piuttosto semplice che comporta il rilevamento anomalo di molti diversi set di dati di conteggio. In particolare, voglio determinare se uno o più valori in una serie di dati di conteggio sono più alti o più bassi del previsto rispetto al …
Esiste un tale pacchetto che prevede la stima del modello di effetti misti binomiali negativi a zero inflazionati in R? Con ciò intendo: Inflazione zero in cui è possibile specificare il modello binomiale per l'inflazione zero, come nella funzione zeroinfl nel pacchetto pscl: zeroinfl (y ~ X | Z, dist …
Ho i dati di conteggio (analisi della domanda / offerta con il numero di conteggio dei clienti, a seconda - possibilmente - di molti fattori). Ho provato una regressione lineare con errori normali, ma la mia trama QQ non è davvero buona. Ho provato una trasformazione del registro della risposta: …
C'è un modo per determinare se una differenza tra un conteggio di incidenti stradali al momento 1 è significativamente diversa da un conteggio al momento 2? Ho trovato metodi diversi per determinare la differenza tra gruppi di osservazioni in momenti diversi (ad esempio, confrontando le medie di Poisson) ma non …
Vorrei utilizzare i dati di conteggio come covariate mentre si adattava un modello di regressione logistica. La mia domanda è: Violo l'assunzione dei modelli logistici (e, più in generale, dei lineari generalizzati) utilizzando variabili di numero intero non negativo come variabili indipendenti? Ho trovato molti riferimenti in letteratura riguardo a …
Ho un set di dati di casi di incidenti per stagione di una malattia rara. Ad esempio, supponiamo che ci siano stati 180 casi in primavera, 90 in estate, 45 in autunno e 210 in inverno. Sto lottando per stabilire se sia appropriato allegare errori standard a questi numeri. Gli …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.