Statistiche e Big Data

Domande e risposte per le persone interessate alle statistiche, all'apprendimento automatico, all'analisi dei dati, al data mining e alla visualizzazione dei dati


5
Cosa imparare dopo Casella e Berger?
Sono una studentessa di matematica pura con poca esperienza in matematica applicata. Dall'autunno scorso ho preso lezioni sul libro di Casella & Berger e ho finito centinaia (230+) di pagine di problemi di esercizio nel libro. In questo momento sono al capitolo 10. Tuttavia, dal momento che non mi sono …


3
Cosa significa "tutto il resto uguale" nella regressione multipla?
Quando facciamo regressioni multiple e diciamo che stiamo osservando la variazione media nella variabile per una variazione in una variabile , mantenendo costanti tutte le altre variabili, a quali valori manteniamo costanti le altre variabili? La loro media? Zero? Qualche valore?xyyyxXx Sono propenso a pensare che abbia valore; sto solo …

2
Perché PCA dei dati mediante SVD dei dati?
Questa domanda riguarda un modo efficiente per calcolare i componenti principali. Molti testi su PCA lineare sostengono l'uso della decomposizione a valore singolare dei dati casewise . Cioè, se abbiamo dati e vogliamo sostituire le variabili (le sue colonne ) con i componenti principali, facciamo SVD: , valori singolari (radici …





2
Come funziona il bootstrap in R?
Ho esaminato il pacchetto di avvio in R e mentre ho trovato una serie di buoni primer su come usarlo, devo ancora trovare qualcosa che descriva esattamente cosa sta succedendo "dietro le quinte". Ad esempio, in questo esempio , la guida mostra come utilizzare i coefficienti di regressione standard come …



1
C'è un motivo per preferire una misura specifica di multicollinearità?
Quando lavoriamo con molte variabili di input, ci preoccupiamo spesso della multicollinearità . Esistono diverse misure di multicollinearità utilizzate per rilevare, riflettere e / o comunicare la multicollinearità. Alcuni consigli comuni sono: Il multiplo per una particolare variabile R2jRj2R^2_j La tolleranza, , per una particolare variabile 1 - R2j1-Rj21-R^2_j Il …

2
Regressione per un modello di forma ?
Ho un set di dati che è la statistica di un forum di discussione web. Sto esaminando la distribuzione del numero di risposte che un argomento dovrebbe avere. In particolare, ho creato un set di dati che contiene un elenco di conteggi delle risposte degli argomenti e quindi il conteggio …


Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.