Ho appena eseguito una regressione lineare (molto) semplice in Genstat e vorrei includere un riassunto sintetico e significativo dell'output nel mio rapporto. Non sono sicuro esattamente quali o quante informazioni dovrei includere. I bit principali del mio output di Genstat si presentano così: Summary of analysis Source d.f. s.s. m.s. …
Qualcuno sa qual è la formula per la distanza di Cook? La formula della distanza originale di Cook utilizza i residui studentizzati, ma perché R usa std. Residui di Pearson durante il calcolo del diagramma della distanza di Cook per un GLM. So che i residui studentizzati non sono definiti …
Sto leggendo molto sull'uso delle spline in vari problemi di regressione. Alcuni libri (ad esempio modelli lineari riccamente Parrameterizzati di Hodges ) raccomandano spline penalizzate. Altri (es. Harrell Regression Modeling Strategies ) optano per spline cubiche ristrette. Quanto sono diversi, in pratica? Otterresti spesso risultati sostanzialmente diversi dall'usare l'uno o …
Leggendo l'articolo "Previsioni su scala" (strumento di previsione di FBProphet, vedi https://peerj.com/preprints/3190.pdf ) mi sono imbattuto nel termine "sparse prior". Gli autori spiegano che stavano usando un simile "precedente rado" per modellare un vettore di deviazioni di velocità da una certa frequenza scalare , che è un parametro del modello …
C'è un modo per ottenere un punteggio di confidenza (possiamo chiamarlo anche valore di confidenza o probabilità) per ciascun valore previsto quando si utilizzano algoritmi come Random Forests o Extreme Gradient Boosting (XGBoost)? Supponiamo che questo punteggio di confidenza varierebbe da 0 a 1 e mostriamo quanto sono fiducioso su …
Sto leggendo il capitolo 13 "Adventures in Covariance" nel ( superbo ) libro Statistical Rethinking di Richard McElreath dove presenta il seguente modello gerarchico: ( Rè una matrice di correlazione) L'autore spiega che LKJcorrè un precedente debolmente informativo che funziona come un precedente regolarizzante per la matrice di correlazione. Ma …
Sono consapevole del fatto che le variabili categoriali con livelli k dovrebbero essere codificate con variabili k-1 nella codifica fittizia (analogamente per le variabili categoriali multivalore). Mi chiedevo quanto fosse un problema una codifica one-hot (ovvero usando invece le variabili k) rispetto alla codifica fittizia per diversi metodi di regressione, …
Sto sperimentando una regressione graduale per motivi di diversità nel mio approccio al problema. Quindi, ho 2 domande: Quali sono i vantaggi della regressione graduale? Quali sono i suoi punti di forza specifici? Cosa ne pensi dell'approccio ibrido, in cui usi la regressione graduale per selezionare le funzionalità e quindi …
Voglio implementare una regressione gaussiana incrementale usando una finestra scorrevole sui punti dati che arrivano uno ad uno attraverso un flusso. Permettere ddddenota la dimensionalità dello spazio di input. Quindi, ogni punto datiXioXiox_i ha ddd numero di elementi. Permettere nnn essere la dimensione della finestra scorrevole. Per fare previsioni, devo …
Ho applicato il test DW al mio modello di regressione in R e ho ottenuto una statistica test DW di 1,78 e un valore p di 2,2e-16 = 0. Questo significa che non c'è autocorrelazione tra i residui perché la stat è vicina a 2 con un piccolo valore p …
Considera una semplice regressione (normalità non assunta): dove è con media e deviazione standard . Le stime del quadrato minimo di e non sono correlate?e i 0 σ a bYio= a + b Xio+ eio,Yi=a+bXi+ei,Y_i = a + b X_i + e_i,eioeie_i000σσ\sigmaun'aaBbb
Come ipotesi di regressione lineare, la normalità della distribuzione dell'errore è talvolta erroneamente "estesa" o interpretata come la necessità della normalità di y o x. È possibile costruire uno scenario / set di dati in cui X e Y non sono normali ma il termine di errore è e quindi …
La regressione della cresta può essere espressa come dove è l'etichetta prevista , la identifica, l'oggetto per cui stiamo cercando di trovare un'etichetta e la matrice di oggetti tale che: y Idd×dxXn×dnxi=(xi,1,...,Xi,d)∈Rdy^= ( X'X +a Id)- 1X xy^=(X′X+aId)−1Xx\hat{y} = (\mathbf{X'X} + a\mathbf{I}_d)^{-1}\mathbf{X}xy^y^\hat{y}iodId\mathbf{I}_dd× dd×dd \times dXx\mathbf{x}XX\mathbf{X}n × dn×dn \times dnnnXio= ( …
Sto usando una foresta casuale su dati raggruppati ad alta dimensione (50 variabili di input numeriche) che hanno una struttura gerarchica. I dati sono stati raccolti con 6 repliche in 30 posizioni di 70 oggetti diversi, ottenendo 12600 punti dati, che non sono indipendenti. Sembra che la foresta casuale stia …
Esiste un metodo per capire se due linee sono (più o meno) parallele? Ho due linee generate da regressioni lineari e vorrei capire se sono parallele. In altre parole, vorrei ottenere le diverse pendenze di queste due linee. Esiste una funzione R per calcolare questo? EDIT: ... e come posso …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.