Sto imparando la regressione lineare usando Introduzione all'analisi della regressione lineare di Montgomery, Peck e Vining . Vorrei scegliere un progetto di analisi dei dati. Ho l'ingenua idea che la regressione lineare sia adatta solo quando si sospetta l'esistenza di relazioni funzionali lineari tra le variabili esplicative e la variabile …
Supponiamo che io abbia un pannello di variabili esplicative , per , , nonché un vettore di variabili binarie dipendenti dal risultato . Quindi Y viene osservato solo nell'ultima volta T e non in qualsiasi momento precedente. Il caso del tutto generale è avere più X_ {ijt} per j = …
Nella mia esposizione in classe al data mining, il metodo di controllo è stato introdotto come un modo per valutare le prestazioni del modello. Tuttavia, quando ho preso la mia prima classe sui modelli lineari, questo non è stato introdotto come mezzo di validazione o valutazione del modello. Anche la …
Vorrei applicare la funzione di base gaussiana in un'implementazione di regressione lineare. Sfortunatamente non riesco a capire un paio di parametri nella funzione base. In particolare μμ\mu e σσ\sigma . Il mio set di dati è una matrice 10.000 x 31. 10.000 campioni e 31 funzioni. Ho letto che "Ogni …
Qui viene discussa l'interpretazione errata dell'assunzione della normalità nella regressione lineare (che la "normalità" si riferisce alla X e / o Y anziché ai residui) e il poster chiede se è possibile avere X e Y non distribuiti normalmente e hanno ancora residui normalmente distribuiti. La mia domanda è: normalmente …
Ho un set di dati molto grande e mancano circa il 5% di valori casuali. Queste variabili sono correlate tra loro. Il seguente set di dati R è solo un esempio di giocattolo con dati correlati fittizi. set.seed(123) # matrix of X variable xmat <- matrix(sample(-1:1, 2000000, replace = TRUE), …
Ho letto le molte eccellenti discussioni sul sito relative all'interpretazione degli intervalli di confidenza e degli intervalli di previsione, ma un concetto è ancora un po 'sconcertante: Considera il framework OLS e abbiamo ottenuto il modello montato . Ci viene dato un e ci viene chiesto di prevederne la risposta. …
Qual è il valore p critico utilizzato dalla step()funzione in R per la regressione graduale? Presumo che sia 0,15, ma la mia ipotesi è corretta? Come posso modificare il valore p critico?
Perché è necessario porre l'assunto distributivo sugli errori, ad es ϵ i ∼ N ( 0 , σ 2 )yio= Xβ+ ϵioyi=Xβ+ϵiy_i = X\beta + \epsilon_{i} , con .εio∼ N( 0 , σ2)ϵi∼N(0,σ2)\epsilon_{i} \sim \mathcal{N}(0,\sigma^{2}) Perché non scrivere y i ~ N ( X β , σ 2 )yio= Xβ+ …
Mi è chiaro, e ben spiegato su più siti, quali informazioni i valori sulla diagonale della matrice del cappello forniscono per la regressione lineare. La matrice del cappello di un modello di regressione logistica è meno chiara per me. È identico alle informazioni che ottieni dalla matrice del cappello applicando …
Ci scusiamo in anticipo se la terminologia che uso non è corretta. Gradirei qualsiasi correzione. Se quello che descrivo come un "cut-off" ha un nome diverso, fammi sapere e posso aggiornare la domanda. La situazione che mi interessa è questa: hai variabili indipendenti e una singola variabile dipendente . Lo …
Qualcuno può indicarmi la direzione di un algoritmo online (ricorsivo) per la regolarizzazione di Tikhonov (minimi quadrati regolarizzati)? In un'impostazione offline, calcolerei usando il mio set di dati originale dove λ si trova usando la convalida incrociata n-fold. È possibile prevedere un nuovo valore y per un dato x usando …
Sono un dottorando in psicologia sperimentale e faccio del mio meglio per migliorare le mie capacità e conoscenze su come analizzare i miei dati. Fino al mio quinto anno di psicologia, ho pensato che i modelli simili alla regressione (ad es. ANOVA) assumessero le seguenti cose: normalità dei dati omogeneità …
Ho un set di dati di serie temporali in cui sto cercando di adattare un modello Hov (Hidden Markov Model) al fine di stimare il numero di stati latenti nei dati. Il mio pseudo codice per farlo è il seguente: for( i in 2 : max_number_of_states ){ ... calculate HMM …
Sto adattando un modello di effetti casuali glmerad alcuni dati aziendali. L'obiettivo è analizzare le prestazioni delle vendite per distributore, tenendo conto delle variazioni regionali. Ho le seguenti variabili: distcode: ID distributore, con circa 800 livelli region: ID geografico di livello superiore (nord, sud, est, ovest) zone: geografia di medio …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.