Va bene, quindi solo un po 'confuso su alcune cose, qualsiasi aiuto sarebbe molto apprezzato. Comprendo che il modello di regressione lineare è previsto tramite un'aspettativa condizionale E( Y| X) = b + Xb + eE(Y|X)=b+Xb+eE(Y|X)=b+Xb+e Supponiamo che sia che siano variabili casuali con qualche distribuzione di probabilità sconosciuta? ho …
Divulgazione completa: non sono uno statistico, né pretendo di esserlo. Sono un modesto amministratore IT. Per favore, sii gentile con me. :) Sono responsabile della raccolta e della previsione dell'utilizzo dell'archiviazione su disco per la nostra azienda. Raccogliamo il nostro utilizzo dello storage mensilmente e utilizziamo una semplice regressione lineare …
Ho supervisionato un problema di apprendimento in cui gli obiettivi sono angoli. Se farei una semplice regressione, i numeri 360 e 1 sarebbero lontani per il mio modello, ma in realtà sono vicini e prevedere le coordinate xey non sembra giusto, dal momento che sto cercando di prevedere solo un …
La regressione può essere utilizzata per il rilevamento di lier out. Capisco che ci sono modi per migliorare un modello di regressione rimuovendo gli outlier. Ma l'obiettivo principale qui non è quello di adattarsi a un modello di regressione, ma scoprire le bugie usando la regressione
Ho avuto un paio di domande sull'interpretazione dei rapporti di probabilità per variabili continue nella regressione logistica. Sento che queste sono domande di base sulla regressione logistica (e probabilmente sulla regressione in generale), e anche se mi vergogno leggermente di non conoscere le risposte, ingoierò il mio orgoglio e le …
Sto cercando di scoprire quale SVR è adatto a quel tipo di dati. Conosco 4 tipi di SVR: epsilon nu minimi quadrati e lineare. Capisco che SVR lineare è più o meno come un lazo con L1 Reg, ma qual è la differenza tra le restanti 3 tecniche?
Ho 100.000 osservazioni (9 variabili indicatrici fittizie) con 1000 positivi. La regressione logistica dovrebbe funzionare bene in questo caso, ma la probabilità di taglio mi confonde. Nella letteratura comune, scegliamo il 50% di cutoff per prevedere 1 e 0 secondi. Non posso farlo poiché il mio modello fornisce un valore …
Se ho un modello di regressione: dove e ,Y= Xβ+ εY=Xβ+ε Y = X\beta + \varepsilon V [ε]=Id∈ Rn × nV[ε]=Id∈Rn×n\mathbb{V}[\varepsilon] = Id \in \mathcal{R} ^{n \times n}E [ε]=(0,…,0)E[ε]=(0,…,0)\mathbb{E}[\varepsilon]=(0, \ldots , 0) quando usare , lo stimatore ordinario dei minimi quadrati di , sarebbe una cattiva scelta per uno stimatore?βOLSβOLS\beta_{\text{OLS}}ββ\beta …
Vorrei verificare Rse i miei dati corrispondono alle distribuzioni log-normali o Pareto. Come potrei farlo? Forse ks.testmi potrebbe aiutare a farlo, ma come potrei ottenere i parametri e per la distribuzione di Pareto per i miei dati?αα\alphakkk
Come puoi dimostrare che le equazioni normali: hanno una o più soluzioni senza supporre che X sia invertibile?(XTX)β=XTY(XTX)β=XTY(X^TX)\beta = X^TY La mia unica ipotesi è che abbia qualcosa a che fare con l'inverso generalizzato, ma sono totalmente perso.
Qualcuno può aiutare a dare una spiegazione concettuale di come vengono fatte le previsioni per i nuovi dati quando si utilizzano smooths / spline per un modello predittivo? Ad esempio, dato un modello creato usando gamboostnel mboostpacchetto in R, con p-splines, come vengono fatte le previsioni per i nuovi dati? …
Qual è il significato di t valuee Pr(>|t|)quando si utilizza la summary()funzione sul modello di regressione lineare in R? Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 10.1595 1.3603 7.469 1.11e-13 *** log(var) 0.3422 0.1597 2.143 0.0322 *
Sto tentando di modellare una variabile di risposta che è teoricamente limitata tra -225 e +225. La variabile è il punteggio totale ottenuto dai soggetti durante una partita. Sebbene teoricamente sia possibile per i soggetti segnare +225. Ciononostante, poiché il punteggio dipendeva non solo dalle azioni dei soggetti, ma anche …
Ho grandi dati di rilievo, una variabile di risultato binaria e molte variabili esplicative tra cui binarie e continue. Sto costruendo set di modelli (sperimentando sia GLM che GLM misto) e usando approcci teorici per selezionare il modello di punta. Ho esaminato attentamente le spiegazioni (sia continue che categoriche) per …
Sto osservando strani schemi nei residui per i miei dati: [EDIT] Ecco i grafici di regressione parziale per le due variabili: [EDIT2] Aggiunto il grafico PP La distribuzione sembra andare bene (vedi sotto) ma non ho idea di da dove possa venire questa retta. Qualche idea? [AGGIORNAMENTO 31.07] Si scopre …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.