Domande e risposte per le persone interessate alle statistiche, all'apprendimento automatico, all'analisi dei dati, al data mining e alla visualizzazione dei dati
Considera la figura seguente dei Modelli lineari di Faraway con R (2005, p. 59). Il primo diagramma sembra indicare che i valori residui e adattati non sono correlati, come dovrebbero essere in un modello lineare omoscedastico con errori normalmente distribuiti. Pertanto, il secondo e il terzo diagramma, che sembrano indicare …
Ho i dati raccolti da un esperimento organizzato come segue: Due siti, ciascuno con 30 alberi. 15 sono trattati, 15 controllano ogni sito. Da ogni albero, campioniamo tre pezzi dello stelo e tre pezzi delle radici, quindi 6 campioni di livello 1 per albero che è rappresentato da uno dei …
Errore quadratico medio radice somma residua di quadrati errore standard residuo errore quadratico medio errore di prova Pensavo di capire questi termini, ma più faccio problemi statistici, più mi sono confuso dove secondo me stesso. Vorrei una rassicurazione e un esempio concreto Riesco a trovare le equazioni abbastanza facilmente online, …
Questo problema sembra sollevare continuamente la sua brutta testa e sto cercando di decapitarlo per la mia comprensione delle statistiche (e della sanità mentale!). Le assunzioni dei modelli lineari generali (t-test, ANOVA, regressione ecc.) Includono l '"assunzione della normalità", ma ho scoperto che raramente viene descritto chiaramente. Mi capita spesso …
Il mio programma statistico implementa sia le procedure del tasso di falsa scoperta (FDR) Benjamini & Hochberg (1995) sia Benjamini & Yekutieli (2001). Ho fatto del mio meglio per leggere l'articolo successivo, ma è abbastanza matematicamente denso e non sono ragionevolmente certo di capire la differenza tra le procedure. Dal …
Mi riferisco a questo documento: Hayes JR, Groner JI. "Utilizzo di punteggi multipli di imputazione e propensione per testare l'effetto dei seggiolini auto e dell'utilizzo delle cinture di sicurezza sulla gravità delle lesioni dai dati del registro dei traumi." J Pediatr Surg. Maggio 2008; 43 (5): 924-7. In questo studio, …
Esistono numerosi thread in CrossValidated sull'argomento di selezione del modello e convalida incrociata. Eccone alcuni: Convalida incrociata interna vs esterna e selezione del modello La risposta principale di DikranMarsupial alla selezione e alla convalida incrociata delle funzioni Tuttavia, le risposte a questi thread sono abbastanza generiche e evidenziano principalmente i …
Sto cercando di capire quando usare un effetto casuale e quando non è necessario. Mi è stato detto che una regola empirica è se hai 4 o più gruppi / individui che faccio (15 alci individuali). Alcuni di questi alci sono stati sperimentati 2 o 3 volte per un totale …
Ho letto alcuni articoli che parlano dei pro e dei contro di ciascun metodo, alcuni sostengono che GA non dia alcun miglioramento nel trovare la soluzione ottimale, mentre altri dimostrano che è più efficace. Sembra che GA sia generalmente preferito in letteratura (anche se la maggior parte delle persone lo …
Ho studiato il significato della proprietà semi-definita positiva delle matrici di correlazione o covarianza. Sto cercando informazioni su Definizione di semi-definitività positiva; Le sue proprietà importanti, implicazioni pratiche; La conseguenza di avere determinante negativo, impatto sull'analisi multivariata o risultati della simulazione ecc.
Mi chiedo quali siano le differenze tra GLM misti e non miscelati. Ad esempio, in SPSS il menu a discesa consente agli utenti di adattare: analyze-> generalized linear models-> generalized linear models & analyze-> mixed models-> generalized linear Trattano diversamente i valori mancanti? La mia variabile dipendente è binaria e …
Nel mio set di dati abbiamo variabili sia continue che naturalmente discrete. Voglio sapere se possiamo fare un cluster gerarchico usando entrambi i tipi di variabili. E se sì, quale misura di distanza è appropriata?
Questa domanda potrebbe essere troppo aperta per ottenere una risposta definitiva, ma speriamo di no. Gli algoritmi di apprendimento automatico, come SVM, GBM, Random Forest ecc., Generalmente hanno alcuni parametri gratuiti che, al di là di una guida empirica, devono essere adattati a ciascun set di dati. Questo viene generalmente …
Qualcuno può offrire una spiegazione breve e concisa sul perché non è una buona idea insegnare agli studenti che un valore p è il prob (i loro risultati sono dovuti al caso [casuale]). La mia comprensione è che un valore p è il prob (ottenere dati più estremi | l'ipotesi …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.