Domande e risposte per le persone interessate alle statistiche, all'apprendimento automatico, all'analisi dei dati, al data mining e alla visualizzazione dei dati
La scorsa settimana ho partecipato a un incontro della Society for Personality and Social Psychology in cui ho visto un discorso di Uri Simonsohn con la premessa che l'uso di un'analisi di potenza a priori per determinare la dimensione del campione era essenzialmente inutile perché i suoi risultati sono così …
Ho trovato definizioni forse contrastanti per la statistica di convalida incrociata (CV) e per la statistica di convalida incrociata generalizzata (GCV) associata a un modello lineare Y=Xβ+εY=Xβ+εY = X\boldsymbol\beta + \boldsymbol\varepsilon (con un vettore di errore omoscedastico normale εε\boldsymbol\varepsilon ). Da un lato, Golub, Heath & Wahba definiscono la stima …
Ho ripetutamente respinto o non sono riuscito a respingere l'ipotesi nulla. Nel caso in cui non si respinga il caso, si conclude che non ci sono prove sufficienti per il rifiuto e si "passa" (ovvero, raccogliere più dati, terminare l'esperimento ecc.) Ma quando "fai" respingi l'ipotesi nulla, fornendo alcune prove …
Ho letto il seguente documento: Perneger (1998) Cosa c'è che non va nelle regolazioni di Bonferroni . L'autore ha riassunto affermando che l'aggiustamento di Bonferroni ha, nella migliore delle ipotesi, applicazioni limitate nella ricerca biomedica e non dovrebbe essere usato quando si valutano prove su ipotesi specifiche: Punti di riepilogo: …
Capisco che dovremmo usare ARIMA per modellare una serie temporale non stazionaria. Inoltre, tutto ciò che ho letto dice che ARMA dovrebbe essere usato solo per serie storiche stazionarie. Quello che sto cercando di capire è, cosa succede in pratica quando si classificano erroneamente un modello e si presume d …
Sto eseguendo una classificazione dell'albero decisionale utilizzando SPSS su un set di dati con circa 20 predittori (categorico con poche categorie). CHAID (Rilevazione automatica dell'interazione Chi-quadrato) e CRT / CART (alberi di classificazione e regressione) mi danno alberi diversi. Qualcuno può spiegare i meriti relativi di CHAID vs CRT? Quali …
Sto lavorando a un progetto in cui desidero estrarre alcune informazioni sul contenuto di una serie di saggi aperti. In questo particolare progetto, 148 persone hanno scritto saggi su un'ipotetica organizzazione studentesca nell'ambito di un esperimento più ampio. Anche se nel mio campo (psicologia sociale), il modo tipico di analizzare …
Mi chiedo se ci sono metodi per calcolare la dimensione del campione in modelli misti? Sto usando lmerin R per adattarsi ai modelli (ho pendenze e intercettazioni casuali).
Mi sono imbattuto in uno studio in cui i pazienti, che avevano tutti i 50 anni, erano pseudo-randomizzati entro l'anno di nascita. Se l'anno di nascita era un numero pari, le cure usuali, se un numero dispari, l'intervento. È più facile da implementare, è più difficile da sovvertire (è facile …
Penso che un'ipotesi di base dell'apprendimento automatico o della stima dei parametri sia che i dati invisibili provengano dalla stessa distribuzione dell'insieme di formazione. Tuttavia, in alcuni casi pratici, la distribuzione del set di test sarà quasi diversa dal set di training. Supponiamo che si tratti di un problema di …
Utilizzando la distribuzione t dello studente con k>0k>0k > 0 gradi di libertà, il parametro di posizione e il parametro di scala hanno densitàslllsss Γ(k+12)Γ(k2kπs2−−−−√){1+k−1(x−ls)}−(k+1)/2,Γ(k+12)Γ(k2kπs2){1+k−1(x−ls)}−(k+1)/2,\frac{\Gamma \left(\frac{k+1}{2}\right)}{\Gamma\left(\frac{k}{2}\sqrt{k \pi s^2}\right)} \left\{ 1 + k^{-1}\left( \frac{x-l}{s}\right)\right\}^{-(k+1)/2}, come dimostrare che la distribuzione Student può essere scritta come una miscela di distribuzioni gaussiane lasciando , …
Volevo porre una domanda ispirata a un'eccellente risposta all'interrogazione sull'intuizione per la distribuzione beta. Volevo capire meglio la derivazione per la distribuzione precedente per la media battuta. Sembra che David stia ritirando i parametri dalla media e dall'intervallo. Partendo dal presupposto che la media sia e la deviazione standard sia …
Esiste un'implementazione della foresta casuale R che funziona bene con dati molto sparsi? Ho migliaia o milioni di variabili di input booleane, ma solo centinaia o giù di lì saranno VERE per ogni dato esempio. Sono relativamente nuovo su R e ho notato che esiste un pacchetto "Matrix" per gestire …
Sto leggendo "The Drunkard's Walk" ora e non riesco a capirne una storia. Eccolo: Immagina che George Lucas realizzi un nuovo film di Star Wars e in un mercato di test decida di eseguire un esperimento folle. Rilascia lo stesso film con due titoli: "Star Wars: episodio A" e "Star …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.