Statistiche e Big Data

Domande e risposte per le persone interessate alle statistiche, all'apprendimento automatico, all'analisi dei dati, al data mining e alla visualizzazione dei dati



10
Qual è la differenza tra "verosimiglianza" e "probabilità"?
La pagina di Wikipedia afferma che la probabilità e la probabilità sono concetti distinti. Nel linguaggio non tecnico, "verosimiglianza" è generalmente sinonimo di "probabilità", ma nell'uso statistico esiste una chiara distinzione in prospettiva: il numero che è la probabilità di alcuni risultati osservati dato un insieme di valori di parametro …



20
Le due culture: statistica vs. apprendimento automatico?
L'anno scorso ho letto un post sul blog di Brendan O'Connor intitolato "Statistiche contro apprendimento automatico, lotta!" che ha discusso alcune delle differenze tra i due campi. Andrew Gelman ha risposto favorevolmente a questo : Simon Blomberg: Dal pacchetto fortune di R: Per parafrasare in modo provocatorio, "l'apprendimento automatico è …


5
Come capire gli svantaggi di K-significa
K-medie è un metodo ampiamente utilizzato nell'analisi dei cluster. Secondo la mia comprensione, questo metodo NON richiede NESSUNA ipotesi, ovvero forniscimi un set di dati e un numero predefinito di cluster, k, e applico solo questo algoritmo che minimizza la somma degli errori al quadrato (SSE), all'interno del cluster al …

25
Python come workbench statistico
Molte persone usano uno strumento principale come Excel o un altro foglio di calcolo, SPSS, Stata o R per le loro esigenze statistiche. Potrebbero rivolgersi a un pacchetto specifico per esigenze molto speciali, ma molte cose possono essere fatte con un semplice foglio di calcolo o un pacchetto di statistiche …
355 r  spss  stata  python 


30
Qual è il tuo fumetto preferito di “analisi dei dati”?
Questo è uno dei miei preferiti: Una voce per risposta. (Questo è nella vena della domanda Stack Overflow Qual è il tuo cartone animato preferito "programmatore"? ). PS Non collegare a caldo il fumetto senza l'autorizzazione del sito, per favore.
343 humor 


11
Spiegare ai non addetti ai lavori perché il bootstrap funziona
Recentemente ho usato il bootstrap per stimare gli intervalli di confidenza per un progetto. Qualcuno che non conosce molto sulle statistiche recentemente mi ha chiesto di spiegare perché il bootstrap funziona, ovvero perché il ricampionamento dello stesso campione più e più volte dà buoni risultati. Mi sono reso conto che, …



Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.