Statistiche e Big Data

Domande e risposte per le persone interessate alle statistiche, all'apprendimento automatico, all'analisi dei dati, al data mining e alla visualizzazione dei dati

2
Stimare il quantile di valore in un vettore
Ho una serie di numeri reali. Devo stimare il quantile di un nuovo numero. C'è un modo pulito per farlo in R? in generale? Spero che questo non sia ultra banale ;-) Molto apprezzato per la tua risposta. PK
26 r 

2
Qual è la distribuzione di nella regressione lineare sotto l'ipotesi nulla? Perché la sua modalità non è zero quando ?
Qual è la distribuzione del coefficiente di determinazione, o R al quadrato, , nella regressione multipla univariata lineare sotto l'ipotesi nulla ?R 2 R2R^2H 0 : β = 0H0:β=0H_0:\beta=0 In che modo dipende dal numero di predittori e dal numero di campioni ? Esiste un'espressione a forma chiusa per la …



2
Come calcolare SVD di una matrice sparsa enorme?
Qual è il modo migliore per calcolare la decomposizione a valore singolare (SVD) di una matrice positiva molto grande (65 M x 3,4 M) in cui i dati sono estremamente scarsi? Meno dello 0,1% della matrice è diverso da zero. Ho bisogno di un modo che: andrà bene nella memoria …
26 svd  numerics 

2
Diagnostica di collinearità problematica solo quando è incluso il termine di interazione
Ho registrato una regressione sulle contee statunitensi e sto verificando la collinearità nelle mie variabili "indipendenti". Belsley, Kuh e Welsch's Regression Diagnostics suggeriscono di esaminare l'indice delle condizioni e le proporzioni di decomposizione della varianza: library(perturb) ## colldiag(, scale=TRUE) for model with interaction Condition Index Variance Decomposition Proportions (Intercept) inc09_10k …



6
Adatta un termine sinusoidale ai dati
Anche se ho letto questo post, non ho ancora idea di come applicare questo ai miei dati e spero che qualcuno mi possa aiutare. Ho i seguenti dati: y <- c(11.622967, 12.006081, 11.760928, 12.246830, 12.052126, 12.346154, 12.039262, 12.362163, 12.009269, 11.260743, 10.950483, 10.522091, 9.346292, 7.014578, 6.981853, 7.197708, 7.035624, 6.785289, 7.134426, 8.338514, …
26 r  regression  fitting 



5
Strategie per l'introduzione di statistiche avanzate a vari pubblici
Lavoro principalmente con non statistici in settori come la medicina, le scienze sociali e l'istruzione. Che io stia consultando studenti laureati, aiutando i ricercatori con articoli o esaminando articoli per riviste, ho spesso il problema che qualcuno (cliente, autore, comitato di tesi, editore di riviste) voglia usare una tecnica relativamente …
26 consulting 




Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.