Quando si risolvono i problemi aziendali utilizzando i dati, è comune che almeno un'ipotesi chiave secondo cui le statistiche classiche sottostanti non siano valide. Il più delle volte, nessuno si preoccupa di controllare quei presupposti in modo da non saperlo mai. Ad esempio, il fatto che molte delle metriche web …
Suppongo di sentirmi frustrato ogni volta che sento qualcuno dire che la non normalità dei residui e / o l'eteroschedasticità violano le ipotesi OLS. Per stimare i parametri in un modello OLS nessuna di queste assunzioni è necessaria dal teorema di Gauss-Markov. Vedo come questo conta nei test di ipotesi …
Ho a che fare con dati lineari con valori anomali, alcuni dei quali sono al massimo le 5 deviazioni standard dalla linea di regressione stimata. Sto cercando una tecnica di regressione lineare che riduca l'influenza di questi punti. Finora quello che ho fatto è stato stimare la linea di regressione …
Ho cercato di replicare i risultati dell'opzione Stata robustin R. Ho usato il rlmcomando dal pacchetto MASS e anche il comando lmrobdal pacchetto "robustbase". In entrambi i casi i risultati sono abbastanza diversi dall'opzione "robusta" di Stata. Qualcuno può suggerire qualcosa in questo contesto? Ecco i risultati che ho ottenuto …
Esistono numerosi stimatori di scala robusti . Un esempio notevole è la deviazione assoluta mediana che si riferisce alla deviazione standard come . In un quadro bayesiano esistono numerosi modi per stimare in modo robusto la posizione di una distribuzione approssimativamente normale (diciamo una Normale contaminata da valori anomali), ad …
Questa domanda è stata posta dal mio amico che non è esperto di Internet. Non ho un background statistico e ho cercato su Internet questa domanda. La domanda è: è possibile sostituire i valori anomali con un valore medio? se è possibile, ci sono riferimenti / riviste di libri per …
La mia domanda scaturisce da questo commento su un post sul blog di Andrew Gelman in cui sostiene l'uso di intervalli di confidenza al 50% invece di intervalli di confidenza al 95%, sebbene non sulla base del fatto che sono stimati in modo più robusto: Preferisco intervalli dal 50% al …
In questo post del blog di Andrew Gelman, c'è il seguente passaggio: I modelli bayesiani di 50 anni fa sembrano irrimediabilmente semplici (tranne, ovviamente, per problemi semplici), e mi aspetto che i modelli bayesiani di oggi sembrino irrimediabilmente semplici, a distanza di 50 anni. (Solo per un semplice esempio: dovremmo …
Sto usando il pacchetto robustbase per eseguire una stima glm. Tuttavia quando lo faccio, ottengo il seguente errore: Error in solve.default(crossprod(X, DiagB * X)/nobs, EEq) : system is computationally singular: reciprocal condition number = 1.66807e-16 Cosa significa / indica? E come posso eseguire il debug? PS. Se hai bisogno di …
Provenendo dal campo della visione artificiale, ho spesso usato il metodo RANSAC (Random Sample Consensus) per adattare i modelli ai dati con molti valori anomali. Tuttavia, non l'ho mai visto usato dagli statistici e ho sempre avuto l'impressione che non fosse considerato un metodo "statisticamente valido". Perchè è così? È …
Ho letto che il test t è "ragionevolmente robusto" quando le distribuzioni dei campioni si discostano dalla normalità. Naturalmente, è la distribuzione campionaria delle differenze che sono importanti. Ho dei dati per due gruppi. Uno dei gruppi è fortemente distorto sulla variabile dipendente. La dimensione del campione è piuttosto piccola …
Dopo aver eseguito l'analisi dei componenti principali (PCA), voglio proiettare un nuovo vettore nello spazio PCA (ovvero trovare le sue coordinate nel sistema di coordinate PCA). Ho calcolato PCA in linguaggio R utilizzando prcomp. Ora dovrei essere in grado di moltiplicare il mio vettore per la matrice di rotazione PCA. …
Ho stimato un modello lineare robusto Rcon pesi MM usando il rlm()pacchetto MASS. `R`` non fornisce un valore per il modello, ma vorrei averne uno se si tratta di una quantità significativa. Sono anche interessato a sapere se c'è qualche significato nell'avere un valore che pesa la varianza totale e …
Ho intenzione di fare uno studio di simulazione in cui metto a confronto le prestazioni di diverse tecniche di correlazione robuste con diverse distribuzioni (inclinate, con valori anomali, ecc.). Con robusto , intendo il caso ideale di essere robusto contro a) distribuzioni distorte, b) valori anomali ec) code pesanti. Insieme …
Qualcuno può spiegarmi chiaramente la logica matematica che collegherebbe due affermazioni (a) e (b) insieme? Cerchiamo di avere un insieme di valori (parte della distribuzione). Adesso, a) La mediana non dipende da ogni valore [dipende solo da uno o due valori medi]; b) La mediana è il luogo della somma …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.