Statistiche e Big Data

Domande e risposte per le persone interessate alle statistiche, all'apprendimento automatico, all'analisi dei dati, al data mining e alla visualizzazione dei dati

2
Interpretazione dei grafici dei valori residui e di quelli adattati per la verifica delle ipotesi di un modello lineare
Considera la figura seguente dei Modelli lineari di Faraway con R (2005, p. 59). Il primo diagramma sembra indicare che i valori residui e adattati non sono correlati, come dovrebbero essere in un modello lineare omoscedastico con errori normalmente distribuiti. Pertanto, il secondo e il terzo diagramma, che sembrano indicare …

2
Modello di effetti misti con annidamento
Ho i dati raccolti da un esperimento organizzato come segue: Due siti, ciascuno con 30 alberi. 15 sono trattati, 15 controllano ogni sito. Da ogni albero, campioniamo tre pezzi dello stelo e tre pezzi delle radici, quindi 6 campioni di livello 1 per albero che è rappresentato da uno dei …

3
R - Confuso sulla terminologia residua
Errore quadratico medio radice somma residua di quadrati errore standard residuo errore quadratico medio errore di prova Pensavo di capire questi termini, ma più faccio problemi statistici, più mi sono confuso dove secondo me stesso. Vorrei una rassicurazione e un esempio concreto Riesco a trovare le equazioni abbastanza facilmente online, …



2
Quali sono le differenze pratiche tra la Benjamini e la Hochberg (1995) e la Benjamini e la Yekutieli (2001) procedure di falsa scoperta?
Il mio programma statistico implementa sia le procedure del tasso di falsa scoperta (FDR) Benjamini & Hochberg (1995) sia Benjamini & Yekutieli (2001). Ho fatto del mio meglio per leggere l'articolo successivo, ma è abbastanza matematicamente denso e non sono ragionevolmente certo di capire la differenza tra le procedure. Dal …


2
Selezione del modello e convalida incrociata: la strada giusta
Esistono numerosi thread in CrossValidated sull'argomento di selezione del modello e convalida incrociata. Eccone alcuni: Convalida incrociata interna vs esterna e selezione del modello La risposta principale di DikranMarsupial alla selezione e alla convalida incrociata delle funzioni Tuttavia, le risposte a questi thread sono abbastanza generiche e evidenziano principalmente i …



3
Perché la matrice di correlazione deve essere semi-definita positiva e cosa significa essere o meno semi-definita positiva?
Ho studiato il significato della proprietà semi-definita positiva delle matrici di correlazione o covarianza. Sto cercando informazioni su Definizione di semi-definitività positiva; Le sue proprietà importanti, implicazioni pratiche; La conseguenza di avere determinante negativo, impatto sull'analisi multivariata o risultati della simulazione ecc.



5
Puoi esagerare con l'addestramento degli algoritmi di machine learning usando CV / Bootstrap?
Questa domanda potrebbe essere troppo aperta per ottenere una risposta definitiva, ma speriamo di no. Gli algoritmi di apprendimento automatico, come SVM, GBM, Random Forest ecc., Generalmente hanno alcuni parametri gratuiti che, al di là di una guida empirica, devono essere adattati a ciascun set di dati. Questo viene generalmente …


Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.