Ho un ampio set di dati di mercato aggregati sulle vendite di vino negli Stati Uniti e vorrei stimare la domanda di determinati vini di alta qualità. Queste quote di mercato sono state fondamentalmente derivate da un modello di utilità casuale nella forma dove include caratteristiche del prodotto rilevate, indica …
Mi è chiaro, e ben spiegato su più siti, quali informazioni i valori sulla diagonale della matrice del cappello forniscono per la regressione lineare. La matrice del cappello di un modello di regressione logistica è meno chiara per me. È identico alle informazioni che ottieni dalla matrice del cappello applicando …
Ho dati correlati e sto usando un modello di effetti misti di regressione logistica per stimare l'effetto a livello individuale (condizionale) per un predittore di interesse. So che per i modelli marginali standard, l'inferenza sui parametri del modello usando il test Wald è coerente per il rapporto di verosimiglianza e …
Ho un set di dati con 8000 cluster e 4 milioni di osservazioni. Sfortunatamente il mio software statistico, Stata, funziona piuttosto lentamente quando si usa la sua funzione di dati del pannello per la regressione logistica:, xtlogitanche con un sottocampione del 10%. Tuttavia, quando si utilizza la logitfunzione non pannello …
Possiamo interpretare la probabilità posteriore ottenuta da un classificatore che genera un valore di classe previsto e una probabilità (ad esempio, regressione logistica o Naive Bayes) come una sorta di punteggio di confidenza assegnato a quel valore di classe previsto?
Ho la seguente funzione di probabilità: Prob=11+e−zProb=11+e−z\text{Prob} = \frac{1}{1 + e^{-z}} dove z=B0+B1X1+⋯+BnXn.z=B0+B1X1+⋯+BnXn.z = B_0 + B_1X_1 + \dots + B_nX_n. Il mio modello sembra Pr(Y=1)=11+exp(−[−3.92+0.014×(bid)])Pr(Y=1)=11+exp(−[−3.92+0.014×(bid)])\Pr(Y=1) = \frac{1}{1 + \exp\left(-[-3.92 + 0.014\times(\text{bid})]\right)} Questo viene visualizzato tramite una curva di probabilità che assomiglia a quella qui sotto. Sto pensando di aggiungere …
Questa domanda è un po 'generica e prolissa, ma per favore abbi pazienza. Nella mia applicazione, ho molti set di dati, ciascuno composto da ~ 20.000 punti dati con ~ 50 funzionalità e una singola variabile binaria dipendente. Sto tentando di modellare i set di dati utilizzando la regressione logistica …
In un post precedente mi chiedevo come gestire i punteggi EQ-5D . Di recente mi sono imbattuto nella regressione logistica quantistica suggerita da Bottai e McKeown che introduce un modo elegante per gestire risultati limitati. La formula è semplice: l o gi t ( y) = l o g( y- …
Ecco un elenco di coefficienti di regressione logistica (il primo è un'intercettazione) -1059.61966694592 -1.23890500515482 -8.57185269220438 -7.50413155570413 0 1.03152408392552 1.19874787949191 -4.88083274930613 -5.77172565873336 -1.00610998453393 Trovo strano come l'intercettazione sia così bassa e ho un coefficiente che è effettivamente uguale a 0. Non sono del tutto sicuro di come interpretarlo. Lo 0 indica …
Se l'Hosmer-Lemeshow indica una mancanza di adattamento ma l'AIC è il più basso tra tutti i modelli .... dovresti comunque usare il modello? Se elimino una variabile, la statistica di Hosmer-Lemeshow non è significativa (il che significa che non vi è una grave mancanza di adattamento). Ma l'AIC aumenta. Modifica …
Esistono diversi metodi per la previsione di variabili ordinali e categoriali. Quello che non capisco è quanto conta questa distinzione. C'è un semplice esempio che può chiarire cosa non va se cado l'ordine? In quali circostanze non importa? Ad esempio, se anche le variabili indipendenti fossero tutte categoriali / ordinali, …
Divulgazione completa: si tratta di compiti a casa. Ho incluso un collegamento al set di dati ( http://www.bertelsen.ca/R/logistic-regression.sav ) Il mio obiettivo è massimizzare la previsione dei inadempienti sui prestiti in questo set di dati. Ogni modello che ho escogitato finora prevede> 90% dei non inadempienti, ma <40% dei inadempienti …
Ho programmato una regressione logistica usando l' algoritmo IRLS . Vorrei applicare una penalità LASSO per selezionare automaticamente le funzionalità giuste. Ad ogni iterazione, viene risolto quanto segue: (XTWX)δβ^=XT(y−p)(XTWX)δβ^=XT(y−p)\mathbf{\left(X^TWX\right) \delta\hat\beta=X^T\left(y-p\right)} Sia un numero reale non negativo. Non sto penalizzando l'intercettazione come suggerito in The Elements of. Apprendimento statistico . Idem …
Vorrei capire cosa sta facendo il seguente codice. La persona che ha scritto il codice non funziona più qui ed è quasi completamente priva di documenti. Mi è stato chiesto di indagarlo da qualcuno che pensa " è un modello di regressione logistica bayesiana " bglm <- function(Y,X) { # …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.