La statistica del test per il test di Hosmer-Lemeshow (HLT) per la bontà di adattamento (GOF) di un modello di regressione logistica è definita come segue: Il campione viene quindi suddiviso in decili, , per decile si calcolano le seguenti quantità:d=10d=10d=10D1,D2,…,DdD1,D2,…,DdD_1, D_2, \dots , D_{d} O1d=∑i∈DdyiO1d=∑i∈DdyiO_{1d}=\displaystyle \sum_{i \in D_d} y_i …
Immagino che maggiore è un coefficiente su una variabile, maggiore è la capacità del modello di "oscillare" in quella dimensione, offrendo una maggiore opportunità di adattamento al rumore. Anche se penso di avere un ragionevole senso della relazione tra la varianza nel modello e i coefficienti elevati, non ho la …
Sono un ingegnere informatico che impara l'apprendimento automatico, in particolare attraverso i corsi di apprendimento automatico di Andrew Ng . Mentre studiavo la regressione lineare con la regolarizzazione , ho trovato termini che confondono: Regressione con regolarizzazione L1 o regolarizzazione L2 LASSO Regressione della cresta Quindi le mie domande: La …
La regolarizzazione di Tikhonov e la regressione della cresta sono termini spesso usati come se fossero identici. È possibile specificare esattamente qual è la differenza?
Sto cercando di capire l'origine della forma curva delle bande di confidenza associate a una regressione lineare OLS e come si relaziona agli intervalli di confidenza dei parametri di regressione (pendenza e intercetta), ad esempio (usando R): require(visreg) fit <- lm(Ozone ~ Solar.R,data=airquality) visreg(fit) Sembra che la banda sia correlata …
Qualcuno può raccomandare una buona esposizione della teoria alla base della regressione dei minimi quadrati parziali (disponibile online) per qualcuno che capisce SVD e PCA? Ho esaminato molte fonti online e non ho trovato nulla che avesse la giusta combinazione di rigore e accessibilità. Ho esaminato The Elements of Statistical …
Per problemi di regressione, ho visto le persone usare il "coefficiente di determinazione" (aka R quadrato) per eseguire la selezione del modello, ad esempio, trovare il coefficiente di penalità appropriato per la regolarizzazione. Tuttavia, è anche comune usare "errore quadrato medio" o "errore quadrato medio radice" come misura dell'accuratezza della …
Quando si esegue la regressione, ad esempio, due iper parametri da scegliere sono spesso la capacità della funzione (ad es. Il più grande esponente di un polinomio) e la quantità di regolarizzazione. Ciò di cui sono confuso, è perché non scegliere semplicemente una funzione a bassa capacità e quindi ignorare …
Mi sono appena imbattuto nel quartetto di Anscombe (quattro set di dati che hanno statistiche descrittive quasi indistinguibili ma sembrano molto diversi quando vengono tracciati) e sono curioso di sapere se ci sono altri set di dati più o meno noti che sono stati creati per dimostrare l'importanza di alcuni …
Sto adattando un lm()modello a un set di dati che include indicatori per il trimestre finanziario (Q1, Q2, Q3, rendendo il Q4 predefinito). Usando lm(Y~., data = data) Ottengo a NAcome coefficiente per Q3 e un avvertimento che una variabile è stata esclusa a causa delle singolarità. Devo aggiungere una …
Un documento "Calcolo accurato della varianza corrente" all'indirizzo http://www.johndcook.com/standard_deviation.html mostra come calcolare media corrente, varianza e deviazioni standard. Esistono algoritmi in cui i parametri di un modello di regressione lineare o logistica possono essere similmente aggiornati "dinamicamente" man mano che viene fornito ogni nuovo record di addestramento?
Sono un po 'confuso con una lezione sulla regressione lineare tenuta da Andrew Ng su Coursera sull'apprendimento automatico. Lì, ha dato una funzione di costo che minimizza la somma dei quadrati come: 12m∑i=1m(hθ(X(i))−Y(i))212m∑i=1m(hθ(X(i))−Y(i))2 \frac{1}{2m} \sum _{i=1}^m \left(h_\theta(X^{(i)})-Y^{(i)}\right)^2 Capisco da dove viene il . Penso che l'abbia fatto in modo che …
Ho lavorato su un problema di regressione in cui l'input è un'immagine e l'etichetta ha un valore continuo tra 80 e 350. Le immagini sono di alcuni prodotti chimici dopo una reazione. Il colore che risulta indica la concentrazione di un'altra sostanza chimica rimasta, ed è quello che il modello …
Sto cercando di capire perché l'output della regressione logistica di queste due librerie dia risultati diversi. Sto usando il set di dati da UCLA Idre esercitazione , predicendo admitbasa sulla gre, gpae rank. rankviene trattato come variabile categoriale, quindi viene prima convertito in variabile fittizia con rank_1eliminato. Viene inoltre aggiunta …
Sto leggendo un articolo molto interessante di Seller e Shmueli sui modelli di regressione per i dati di conteggio. Quasi all'inizio (p. 944) citano McCullaugh e Nelder (1989) affermando che la regressione binomiale negativa è impopolare e ha un problematico collegamento canonico. Ho trovato il passaggio indicato e dice (p. …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.