Statistiche e Big Data

Domande e risposte per le persone interessate alle statistiche, all'apprendimento automatico, all'analisi dei dati, al data mining e alla visualizzazione dei dati


3
Come selezionare un metodo di clustering? Come convalidare una soluzione di cluster (per giustificare la scelta del metodo)?
Uno dei maggiori problemi con l'analisi dei cluster è che potrebbe capitare di dover trarre conclusioni diverse quando si basano su diversi metodi di clustering utilizzati (inclusi diversi metodi di collegamento nel clustering gerarchico). Mi piacerebbe conoscere la tua opinione su questo - quale metodo sceglierai e come. Si potrebbe …


3
Linearità della PCA
La PCA è considerata una procedura lineare, tuttavia: P C A ( X) ≠ P C A ( X1) + P C A ( X2) + … + P C A ( Xn) ,PCUN(X)≠PCUN(X1)+PCUN(X2)+...+PCUN(Xn),\mathrm{PCA}(X)\neq \mathrm{PCA}(X_1)+\mathrm{PCA}(X_2)+\ldots+\mathrm{PCA}(X_n), dove . Ciò significa che gli autovettori ottenuti dai PCA sulle matrici di dati non …
35 pca  linear 




6
Tutti i metodi di simulazione sono una forma di Monte Carlo?
Esiste un metodo di simulazione che non è Monte Carlo? Tutti i metodi di simulazione prevedono la sostituzione di numeri casuali nella funzione per trovare un intervallo di valori per la funzione. Quindi, in sostanza, tutti i metodi di simulazione sono metodi Monte Carlo?

4
Come può una distribuzione avere media e varianza infinite?
Sarebbe apprezzato se si potessero dare i seguenti esempi: Una distribuzione con media infinita e varianza infinita. Una distribuzione con media infinita e varianza finita. Una distribuzione con media finita e varianza infinita. Una distribuzione con media finita e varianza finita. Viene da me vedere questi termini sconosciuti (media infinita, …

5
Come risolvere il paradosso di Simpson?
Il paradosso di Simpson è un classico rompicapo discusso in corsi introduttivi di statistica in tutto il mondo. Tuttavia, il mio corso era contento di notare semplicemente che esisteva un problema e non forniva una soluzione. Vorrei sapere come risolvere il paradosso. Cioè, di fronte al paradosso di un Simpson, …

1
Regressione quantile: quali errori standard?
La summary.rqfunzione della vignetta quantreg offre una moltitudine di scelte per le stime di errore standard dei coefficienti di regressione quantile. Quali sono gli scenari speciali in cui ognuno di questi diventa ottimale / desiderabile? "rango" che produce intervalli di confidenza per i parametri stimati invertendo un test di rango …




3
PCA e divisione treno / prova
Ho un set di dati per il quale ho più set di etichette binarie. Per ogni set di etichette, alleno un classificatore, valutandolo per convalida incrociata. Voglio ridurre la dimensionalità utilizzando l'analisi dei componenti principali (PCA). La mia domanda è: È possibile eseguire il PCA una volta per l'intero set …

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.