Nella regressione lineare semplice si vuole spesso verificare se alcune assunzioni sono soddisfatte per poter fare l'inferenza (ad esempio i residui sono normalmente distribuiti). È ragionevole verificare le ipotesi verificando che i valori adattati siano normalmente distribuiti?
Ho applicato alcuni dati per trovare la migliore soluzione di variabili del modello di regressione usando la regressione della cresta in R. Ho usato lm.ridgee glmnet(quando alpha=0), ma i risultati sono molto diversi soprattutto quando lambda=0. Supponiamo che entrambi gli stimatori dei parametri abbiano gli stessi valori. Quindi, qual è …
In precedenza avevo appreso delle distribuzioni di campionamento che davano risultati che erano per lo stimatore, in termini di parametro sconosciuto. Ad esempio, per le distribuzioni di campionamento di e nel modello di regressione lineare β 1Yi=βo+β1Xi+εiβ^0β^0\hat\beta_0β^1β^1\hat\beta_1Yi=βo+β1Xi+εiYi=βo+β1Xi+εiY_i = \beta_o + \beta_1 X_i + \varepsilon_i β^0∼N(β0, σ2(1n+x¯2Sxx))β^0∼N(β0, σ2(1n+x¯2Sxx)) \hat{\beta}_0 \sim \mathcal …
Voglio associare i difetti di codice a metriche di complessità del codice come la vicinanza. Un modello comune è quello di vedere questo come un processo di Poisson, in cui la durata è il tempo impiegato per la codifica e la densità è una funzione della complessità del codice. Sono …
Disclaimer: questo è per un progetto di compiti a casa. Sto cercando di trovare il modello migliore per i prezzi dei diamanti, a seconda di diverse variabili e finora sembra che abbia un modello abbastanza buono. Tuttavia ho incontrato due variabili che sono ovviamente collineari: >with(diamonds, cor(data.frame(Table, Depth, Carat.Weight))) Table …
Quali sono le applicazioni o i vantaggi della regressione della riduzione dimensionale (DRR) o delle tecniche di riduzione dimensionale supervisionata (SDR) rispetto alle tecniche di regressione tradizionale (senza alcuna riduzione dimensionale)? Questa classe di tecniche trova una rappresentazione a bassa dimensione dell'insieme di funzionalità per il problema di regressione. Esempi …
Voglio fare una regressione logistica ordinale in R senza l'assunzione delle probabilità di proporzionalità. So che questo può essere fatto direttamente usando la vglm()funzione Rimpostando parallel=FALSE. Ma il mio problema è come risolvere un particolare insieme di coefficienti in questa configurazione di regressione? Ad esempio, supponiamo che la variabile dipendente …
Sono a conoscenza del test di ripristino Ramsey che può rilevare dipendenze non lineari. Tuttavia, se si elimina semplicemente uno dei coefficienti di regressione (dipendenze semplicemente lineari), è possibile che si verifichi una distorsione, a seconda delle correlazioni. Questo ovviamente non viene rilevato dal test di ripristino. Non ho trovato …
Frequento un corso di analisi dei dati e alcune delle mie idee ben radicate vengono scosse. Vale a dire, l'idea che l'errore (epsilon), così come qualsiasi altro tipo di varianza, si applica solo (così ho pensato) a un gruppo (un campione o l'intera popolazione). Ora, ci viene insegnato che una …
Ho dei dati che assomigliano a: Ho provato ad applicare la distribuzione normale (la stima della densità del kernel funziona meglio, ma non ho bisogno di una precisione così grande) e funziona abbastanza bene. Il diagramma della densità crea un'ellisse. Devo ottenere quella funzione dell'ellisse per decidere se un punto …
Ho bisogno di un piccolo aiuto per muovermi nella giusta direzione. È da tanto che non studio tutte le statistiche e il gergo sembra essere cambiato. Immagina di avere una serie di dati relativi all'auto come Durata del viaggio dalla città A alla città B Distanza dalla città A alla …
Ho iniziato a scavare un po 'nella funzione plot.lm , questa funzione fornisce sei grafici per lm, sono: un diagramma di residui contro valori adattati un grafico in scala di posizione di sqrt (| residui |) rispetto ai valori adattati un diagramma QQ normale, un diagramma delle distanze di Cook …
Dopo aver eseguito una regressione del modulo reg <- lm(y ~ x1 + x2, data=example)su un set di dati, posso ottenere i valori previsti utilizzando predict(reg, example, interval="prediction", level=0.95) Mi chiedo a cosa si riferiscano effettivamente i valori previsti quando sto usando la regressione per prevedere il set di dati …
Antefatto: attualmente sono un biostatista alle prese con un set di dati di tassi di espressione cellulare. Lo studio ha esposto una serie di cellule, raccolte in gruppi da vari donatori, a determinati peptidi. Le cellule esprimono determinati biomarcatori in risposta, oppure no. I tassi di risposta vengono quindi registrati …
Vorrei sapere se ha senso studiare le trame dei residui rispetto alla variabile dipendente quando ho una regressione univariata. Se ha senso, cosa significa una correlazione crescente, lineare e crescente tra i residui (sull'asse y) e i valori stimati della variabile dipendente (sull'asse x)?
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.