Statistiche e Big Data

Domande e risposte per le persone interessate alle statistiche, all'apprendimento automatico, all'analisi dei dati, al data mining e alla visualizzazione dei dati


7
Quando si esegue la regressione multipla, quando è necessario centrare le variabili del predittore e quando è necessario standardizzarle?
In alcune pubblicazioni, ho letto che una regressione con più variabili esplicative, se in unità diverse, doveva essere standardizzata. (La standardizzazione consiste nel sottrarre la media e dividere per la deviazione standard.) In quali altri casi devo standardizzare i miei dati? Ci sono casi in cui dovrei solo centrare i …


6
Come normalizzare i dati nell'intervallo 0-1?
Mi sono perso nella normalizzazione, qualcuno potrebbe guidarmi per favore. Ho un valore minimo e massimo, diciamo rispettivamente -23.89 e 7.54990767. Se ottengo un valore di 5,6878 come posso ridimensionare questo valore su una scala da 0 a 1.

11
Come capire i gradi di libertà?
Da Wikipedia , ci sono tre interpretazioni dei gradi di libertà di una statistica: In statistica, il numero di gradi di libertà è il numero di valori nel calcolo finale di una statistica che sono liberi di variare . Le stime dei parametri statistici possono essere basate su diverse quantità …




8
Perché la distanza euclidea non è una buona metrica in dimensioni elevate?
Ho letto che "la distanza euclidea non è una buona distanza in dimensioni elevate". Immagino che questa affermazione abbia qualcosa a che fare con la maledizione della dimensionalità, ma cosa esattamente? Inoltre, che cosa sono le "alte dimensioni"? Ho applicato il clustering gerarchico usando la distanza euclidea con 100 funzioni. …


2
Interpretazione dell'output di R's lm ()
Le pagine di aiuto in R presumono che io sappia cosa significano quei numeri, ma non lo so. Sto cercando di capire davvero in modo intuitivo ogni numero qui. Pubblicherò solo l'output e commenterò ciò che ho scoperto. Potrebbero esserci (saranno) errori, poiché scriverò solo ciò che presumo. Principalmente vorrei …

6
È
Stavo sfogliando alcune note di lezione di Cosma Shalizi (in particolare, la sezione 2.1.1 della seconda lezione ), e mi è stato ricordato che puoi ottenere molto bassi R2R2R^2anche quando hai un modello completamente lineare. Per parafrasare l'esempio di Shalizi: supponiamo di avere un modello Y=aX+ϵY=aX+ϵY = aX + \epsilon …




Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.