Statistiche e Big Data

Domande e risposte per le persone interessate alle statistiche, all'apprendimento automatico, all'analisi dei dati, al data mining e alla visualizzazione dei dati


4
Come calcolare la distribuzione cumulativa in R?
Bloccato . Questa domanda e le sue risposte sono bloccate perché la domanda è fuori tema ma ha un significato storico. Al momento non accetta nuove risposte o interazioni. Devo calcolare la funzione di distribuzione cumulativa di un campione di dati. C'è qualcosa di simile a hist () in R …
23 r  distributions  cdf 


3
Visualizzazione della calibrazione della probabilità prevista di un modello
Supponiamo che io abbia un modello predittivo che produce, per ogni istanza, una probabilità per ogni classe. Ora riconosco che ci sono molti modi per valutare un tale modello se voglio usare quelle probabilità per la classificazione (precisione, richiamo, ecc.). Riconosco anche che una curva ROC e l'area sottostante possono …





3
Come testare l'autocorrelazione dei residui?
Ho una matrice con due colonne che hanno molti prezzi (750). Nell'immagine qui sotto ho tracciato i residui della seguente regressione lineare: lm(prices[,1] ~ prices[,2]) Guardando l'immagine, sembra essere una forte autocorrelazione dei residui. Tuttavia, come posso verificare se l'autocorrelazione di tali residui è forte? Quale metodo dovrei usare? Grazie!

3
Siti per gare di modellazione predittiva
Partecipo a gare di modellazione predittiva su Kaggle , TunedIt e CrowdAnalytix . Trovo che questi siti siano un buon modo per "allenarsi" per le statistiche / l'apprendimento automatico. Ci sono altri siti che dovrei conoscere? Come ti senti riguardo alle competizioni in cui l'host intende trarre profitto dalle proposte …





4
Come revisore, posso giustificare che la richiesta di dati e codice sia resa disponibile anche se il diario non lo fa?
Poiché la scienza deve essere riproducibile, per definizione, vi è un crescente riconoscimento del fatto che dati e codice sono una componente essenziale della riproducibilità, come discusso dalla tavola rotonda di Yale per la condivisione di dati e codice . Nel riesaminare un manoscritto per un giornale che non richiede …

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.