Domande e risposte per le persone interessate alle statistiche, all'apprendimento automatico, all'analisi dei dati, al data mining e alla visualizzazione dei dati
Un ex collega una volta mi ha discusso come segue: Solitamente applichiamo test di normalità ai risultati di processi che, sotto il nulla, generano variabili casuali che sono solo asintoticamente o quasi normali (con la parte "asintoticamente" dipendente da una quantità che non possiamo aumentare); Nell'era della memoria economica, dei …
In alcune pubblicazioni, ho letto che una regressione con più variabili esplicative, se in unità diverse, doveva essere standardizzata. (La standardizzazione consiste nel sottrarre la media e dividere per la deviazione standard.) In quali altri casi devo standardizzare i miei dati? Ci sono casi in cui dovrei solo centrare i …
Mi sono perso nella normalizzazione, qualcuno potrebbe guidarmi per favore. Ho un valore minimo e massimo, diciamo rispettivamente -23.89 e 7.54990767. Se ottengo un valore di 5,6878 come posso ridimensionare questo valore su una scala da 0 a 1.
Da Wikipedia , ci sono tre interpretazioni dei gradi di libertà di una statistica: In statistica, il numero di gradi di libertà è il numero di valori nel calcolo finale di una statistica che sono liberi di variare . Le stime dei parametri statistici possono essere basate su diverse quantità …
Dopo aver seguito un corso di statistica e poi aver cercato di aiutare gli altri studenti, ho notato che una materia che ispira molto il battito della testa è l'interpretazione dei risultati dei test statistici di ipotesi. Sembra che gli studenti imparino facilmente come eseguire i calcoli richiesti da un …
Quali sono le somiglianze e le differenze tra questi 3 metodi: insacco, Promuovere, Impilabile? Qual è il migliore? E perché? Puoi darmi un esempio per ciascuno?
Ho letto che "la distanza euclidea non è una buona distanza in dimensioni elevate". Immagino che questa affermazione abbia qualcosa a che fare con la maledizione della dimensionalità, ma cosa esattamente? Inoltre, che cosa sono le "alte dimensioni"? Ho applicato il clustering gerarchico usando la distanza euclidea con 100 funzioni. …
Le pagine di aiuto in R presumono che io sappia cosa significano quei numeri, ma non lo so. Sto cercando di capire davvero in modo intuitivo ogni numero qui. Pubblicherò solo l'output e commenterò ciò che ho scoperto. Potrebbero esserci (saranno) errori, poiché scriverò solo ciò che presumo. Principalmente vorrei …
Stavo sfogliando alcune note di lezione di Cosma Shalizi (in particolare, la sezione 2.1.1 della seconda lezione ), e mi è stato ricordato che puoi ottenere molto bassi R2R2R^2anche quando hai un modello completamente lineare. Per parafrasare l'esempio di Shalizi: supponiamo di avere un modello Y=aX+ϵY=aX+ϵY = aX + \epsilon …
Lo scambio di Joris e Srikant qui mi ha fatto riflettere (di nuovo) se le mie spiegazioni interne per la differenza tra intervalli di confidenza e intervalli credibili fossero quelle giuste. Come spiegheresti la differenza?
Sembra che, attraverso varie domande correlate qui, vi sia consenso sul fatto che la parte "95%" di ciò che chiamiamo un "intervallo di confidenza al 95%" si riferisce al fatto che se dovessimo replicare esattamente le nostre procedure di campionamento e calcolo dell'IC più volte , Il 95% degli EC …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.