Ho un modello di regressione logistica binaria con uno pseudo R-quadrato di McFadden di 0,192 con una variabile dipendente chiamata payment (1 = pagamento e 0 = nessun pagamento). Qual è l'interpretazione di questo pseudo R-quadrato? È un confronto relativo per i modelli nidificati (ad esempio un modello a 6 …
Ho partecipato a una competizione di machine learning in cui usano RMSLE (Root Mean Squared Logarithmic Error) per valutare le prestazioni prevedendo il prezzo di vendita di una categoria di apparecchiature. Il problema è che non sono sicuro di come interpretare il successo del mio risultato finale. Ad esempio, se …
Possiamo usare lm()per prevedere un valore, ma in alcuni casi abbiamo ancora bisogno dell'equazione della formula del risultato. Ad esempio, aggiungere l'equazione ai grafici.
Sto cercando di usare scikit-learn per la regressione polinomiale. Da quello che leggo la regressione polinomiale è un caso speciale di regressione lineare. Stavo pensando che forse uno dei modelli lineari generalizzati di scikit possa essere parametrizzato per adattarsi a polinomi di ordine superiore ma non vedo alcuna opzione per …
Chiuso. Questa domanda è fuori tema . Al momento non accetta risposte. Vuoi migliorare questa domanda? Aggiorna la domanda in modo che sia in argomento per Cross Validated. Chiuso 2 anni fa . Sto usando il cursore per eseguire una foresta casuale convalidata in modo incrociato su un set di …
Sto facendo il corso di Machine Learning Stanford su Coursera. Nel capitolo sulla regressione logistica, la funzione di costo è questa: Quindi, è derivato qui: Ho provato a ottenere la derivata della funzione di costo ma ho ottenuto qualcosa di completamente diverso. Come si ottiene il derivato? Quali sono i …
Quando si adatta un modello di regressione, cosa succede se le ipotesi degli output non sono soddisfatte, in particolare: Cosa succede se i residui non sono omoscedastici? Se i residui mostrano uno schema crescente o decrescente nella trama Residui vs. Cosa succede se i residui non sono normalmente distribuiti e …
βlasso=argminβ∥y−Xβ∥22+α∥β∥1βlasso=argminβ‖y−Xβ‖22+α‖β‖1\beta^{\text{lasso}}= \operatorname*{argmin}_\beta \| y-X\beta\|^2_2 + \alpha \| \beta\|_1βlassoj=sgn(βLSj)(|βLSj|−α)+βjlasso=sgn(βjLS)(|βjLS|−α)+ \beta_j^{\text{lasso}}= \mathrm{sgn}(\beta^{\text{LS}}_j)(|\beta_j^{\text{LS}}|-\alpha)^+ XXX Tuttavia non capisco perché non esiste una soluzione a forma chiusa in generale. Usando le sottodifferenziali ho ottenuto quanto segue. ( XXX è una matrice n×pn×pn \times p ) f(β)=∥y−Xβ∥22+α∥β∥1f(β)=‖y−Xβ‖22+α‖β‖1f(\beta)=\|{y-X\beta}\|_2^2 + \alpha\|{\beta}\|_1 =∑i=1n(yi−Xiβ)2+α∑j=1p|βj|=∑i=1n(yi−Xiβ)2+α∑j=1p|βj| =\sum_{i=1}^n (y_i-X_i\beta)^2 + \alpha \sum_{j=1}^p |\beta_j| …
Ad esempio, considera il ChickWeightset di dati in R. La varianza ovviamente aumenta nel tempo, quindi se uso una semplice regressione lineare come: m <- lm(weight ~ Time*Diet, data=ChickWeight) Le mie domande: Quali aspetti del modello saranno discutibili? I problemi si limitano all'estrapolazione al di fuori Timedell'intervallo? Quanto è tollerante …
Mi sono appena imbattuto in questo documento , che descrive come calcolare la ripetibilità ( nota anche come affidabilità, nota anche come correlazione intraclasse) di una misurazione tramite la modellazione di effetti misti. Il codice R sarebbe: #fit the model fit = lmer(dv~(1|unit),data=my_data) #obtain the variance estimates vc = VarCorr(fit) …
Ho trovato una formula per lo pseudo nel libro Extending the Linear Model with R, Julian J. Faraway (p. 59).R2R2R^2 1−ResidualDevianceNullDeviance1−ResidualDevianceNullDeviance1-\frac{\text{ResidualDeviance}}{\text{NullDeviance}} . È una formula comune per pseudo per GLM?R2R2R^2
Ho appena sfogliato questo meraviglioso libro: analisi statistica multivariata applicata di Johnson e Wichern . L'ironia è che non sono ancora in grado di comprendere la motivazione per l'utilizzo di modelli multivariati (regressione) invece di modelli univariati separati (regressione). Ho esaminato i post 1 e 2 di stats.statexchange che spiegano …
Ho una domanda relativa alla regressione multipla e all'interazione, ispirata a questo thread CV: termine di interazione che utilizza l'analisi della regressione gerarchica con variabili centrate? Quali variabili dovremmo centrare? Quando cerco un effetto di moderazione, concentro le mie variabili indipendenti e moltiplico le variabili centrate per calcolare il mio …
Vorrei capire perché, sotto il modello OLS, l'RSS (somma residua dei quadrati) è distribuito ( è il numero di parametri nel modello, il numero di osservazioni).p nχ2⋅(n−p)χ2⋅(n−p)\chi^2\cdot (n-p)pppnnn Mi scuso per aver posto una domanda così basilare, ma sembra che non riesca a trovare la risposta online (o nei miei …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.