Sono abbastanza nuovo su questo con i test binomiali dei dati, ma dovevo farne uno e ora non sono sicuro di come interpretare il risultato. La variabile y, la variabile di risposta, è binomiale e i fattori esplicativi sono continui. Questo è ciò che ho ottenuto riassumendo il risultato: glm(formula …
Sto cercando di creare un polinomio del secondo ordine adatto ad alcuni dati che ho. Diciamo che ho tracciato questo adattamento con ggplot(): ggplot(data, aes(foo, bar)) + geom_point() + geom_smooth(method="lm", formula=y~poly(x, 2)) Ottengo: Quindi, un secondo ordine funziona abbastanza bene. Lo calcolo con R: summary(lm(data$bar ~ poly(data$foo, 2))) E ottengo: …
X e Y non sono correlati (-.01); tuttavia, quando inserisco X in una regressione multipla che prevede Y, accanto a tre (A, B, C) altre variabili (correlate), X e altre due variabili (A, B) sono predittori significativi di Y. Nota che le altre due ( Le variabili A, B) sono …
Le mie domande Qual è la ragione intuitiva alla base delle rotazioni dei fattori nell'analisi fattoriale (o dei componenti in PCA)? La mia comprensione è che se le variabili sono quasi ugualmente caricate nei componenti (o fattori) principali, ovviamente è difficile differenziare i componenti. Quindi in questo caso si potrebbe …
So che ci sono molti materiali che spiegano il valore p. Tuttavia, il concetto non è facile da comprendere saldamente senza ulteriori chiarimenti. Ecco la definizione di p-value da Wikipedia: Il valore p è la probabilità di ottenere una statistica test almeno estrema quanto quella effettivamente osservata, supponendo che l'ipotesi …
Wikipedia spiega: Per un set di dati, la media è la somma dei valori divisa per il numero di valori. Questa definizione corrisponde tuttavia a ciò che chiamo "medio" (almeno è quello che ricordo di aver appreso). Eppure Wikipedia cita ancora una volta: Esistono altre misure statistiche che utilizzano campioni …
Molte volte mi sono imbattuto in avvertimenti informali contro lo "snooping dei dati" (ecco un esempio divertente ) e penso di avere un'idea intuitiva di ciò che ciò significa e del perché potrebbe essere un problema. D'altra parte, l '"analisi dei dati esplorativi" sembra essere una procedura perfettamente rispettabile in …
Mi sono imbattuto in questo simpatico tutorial: un manuale di analisi statistiche usando R. Capitolo 13. Analisi dei componenti principali: l'eptatlon olimpico su come eseguire la PCA in linguaggio R. Non capisco l'interpretazione della Figura 13.3: Quindi sto tramando il primo autovettore contro il secondo autovettore. Cosa significa? Supponiamo che …
Se capisco correttamente un intervallo di confidenza di un parametro è un intervallo costruito con un metodo che produce intervalli contenenti il valore reale per una determinata percentuale di campioni. Quindi la "fiducia" riguarda il metodo piuttosto che l'intervallo che calcolo da un particolare campione. Come utente di statistiche mi …
Sono un po 'nuovo nell'usare la regressione logistica, e un po' confuso da una discrepanza tra le mie interpretazioni dei seguenti valori che pensavo fossero gli stessi: valori beta esponenziali probabilità prevista del risultato utilizzando i valori beta. Ecco una versione semplificata del modello che sto usando, in cui la …
Sono abbastanza nuovo nelle statistiche e ho bisogno del tuo aiuto. Ho un piccolo campione, come segue: H4U 0.269 0.357 0.2 0.221 0.275 0.277 0.253 0.127 0.246 Ho eseguito il test Shapiro-Wilk usando R: shapiro.test(precisionH4U$H4U) e ho ottenuto il seguente risultato: W = 0.9502, p-value = 0.6921 Ora, se presumo …
Ho partecipato a una competizione di machine learning in cui usano RMSLE (Root Mean Squared Logarithmic Error) per valutare le prestazioni prevedendo il prezzo di vendita di una categoria di apparecchiature. Il problema è che non sono sicuro di come interpretare il successo del mio risultato finale. Ad esempio, se …
Spero che a tutti voi non dispiaccia questa domanda, ma ho bisogno di aiuto per interpretare l'output per un output del modello a effetti misti lineari. Ho cercato di imparare a fare in R. Sono nuovo nell'analisi dei dati longitudinali e nella regressione lineare degli effetti misti. Ho un modello …
Mi sono appena imbattuto in questo documento , che descrive come calcolare la ripetibilità ( nota anche come affidabilità, nota anche come correlazione intraclasse) di una misurazione tramite la modellazione di effetti misti. Il codice R sarebbe: #fit the model fit = lmer(dv~(1|unit),data=my_data) #obtain the variance estimates vc = VarCorr(fit) …
Per i modelli statistici e di apprendimento automatico, esistono diversi livelli di interpretabilità: 1) l'algoritmo nel suo insieme, 2) parti dell'algoritmo in generale 3) parti dell'algoritmo su input particolari e questi tre livelli si dividono in due parti ciascuno, uno per l'allenamento e uno per la valutazione delle funzioni. Le …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.