Statistiche e Big Data

Domande e risposte per le persone interessate alle statistiche, all'apprendimento automatico, all'analisi dei dati, al data mining e alla visualizzazione dei dati



4
Interpretazione della differenza tra distribuzione lognormale e della legge sull'energia (distribuzione dei gradi di rete)
Prima di tutto, non sono uno statistico. Tuttavia, ho fatto analisi statistiche di rete per il mio dottorato. Come parte dell'analisi della rete, ho tracciato una funzione di distribuzione cumulativa complementare (CCDF) di gradi di rete. Quello che ho scoperto è che, diversamente dalle distribuzioni di rete convenzionali (ad es. …


1
Calcolo del potere statistico
A quanto ho capito, ho bisogno di conoscere almeno tre aspetti (su quattro) del mio studio proposto al fine di condurre analisi di potenza, vale a dire: tipo di test - intendo utilizzare Pearson's r e ANCOVA / Regression - GLM livello di significatività (alfa) - Intendo usare 0.05 dimensione …





2
Sulla "forza" dei discenti deboli
Ho diverse domande strettamente correlate riguardanti gli studenti deboli nell'apprendimento in gruppo (ad es. Il potenziamento). Questo può sembrare stupido, ma quali sono i vantaggi dell'utilizzo di studenti deboli piuttosto che forti? (es. perché non potenziare con metodi di apprendimento "forti"?) Esiste una sorta di forza "ottimale" per gli studenti …

2
Buona risorsa online con suggerimenti sull'associazione grafica tra due variabili numeriche in varie condizioni
Contesto: Nel frattempo ho acquisito una serie di euristiche su come tracciare in modo efficace l'associazione tra due variabili numeriche. Immagino che la maggior parte delle persone che lavorano con i dati avrebbe un insieme simile di regole. Esempi di tali regole potrebbero essere: Se una delle variabili è inclinata …

1
Perché le funzioni R 'princomp' e 'prcomp' danno autovalori diversi?
È possibile utilizzare il set di dati del decathlon {FactoMineR} per riprodurre questo. La domanda è perché gli autovalori calcolati differiscono da quelli della matrice di covarianza. Ecco gli autovalori usando princomp: > library(FactoMineR);data(decathlon) > pr <- princomp(decathlon[1:10], cor=F) > pr$sd^2 Comp.1 Comp.2 Comp.3 Comp.4 Comp.5 Comp.6 1.348073e+02 2.293556e+01 9.747263e+00 …
22 r  pca 


4
Come garantire le proprietà della matrice di covarianza quando si adatta il modello normale multivariato utilizzando la massima probabilità?
Supponiamo di avere il seguente modello yi=f(xi,θ)+εiyi=f(xi,θ)+εiy_i=f(x_i,\theta)+\varepsilon_i dove , è un vettore di variabili esplicative, sono i parametri della funzione non lineare e , dove è naturalmente matrice.yi∈RKyi∈RKy_i\in \mathbb{R}^Kxixix_iθθ\thetafffεi∼N(0,Σ)εi∼N(0,Σ)\varepsilon_i\sim N(0,\Sigma)ΣΣ\SigmaK×KK×KK\times K L'obiettivo è il solito per stimare e \ Sigma . La scelta ovvia è il metodo della massima verosimiglianza. …

2
Suggerimenti per migliorare un cheat sheet di probabilità e statistica
Contesto: Nel tentativo di strutturare i pezzi centrali che mi sono imbattuto nella teoria della probabilità e nella statica, ho creato un documento di riferimento incentrato sugli elementi matematici essenziali (disponibile qui ). Condividendo questo documento, spero di fornire agli studenti di statistica un riassunto completo del materiale di base …
22 teaching 

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.