Domande e risposte per le persone interessate alle statistiche, all'apprendimento automatico, all'analisi dei dati, al data mining e alla visualizzazione dei dati
Hinton e Salakhutdinov nel ridurre la dimensionalità dei dati con le reti neurali, Science 2006 ha proposto un PCA non lineare attraverso l'uso di un autoencoder profondo. Ho provato a costruire e addestrare un autoencoder PCA con Tensorflow diverse volte, ma non sono mai stato in grado di ottenere risultati …
Ho letto valori , tassi di errore di tipo 1, livelli di significatività, calcoli di potenza, dimensioni degli effetti e dibattito Fisher vs Neyman-Pearson. Questo mi ha lasciato un po 'sopraffatto. Mi scuso per il muro di testo, ma ho ritenuto necessario fornire una panoramica della mia attuale comprensione di …
Ho avuto una discussione con uno statistico nel 2009 in cui ha affermato che il valore esatto di un valore p è irrilevante: l'unica cosa importante è se è significativo o meno. Cioè un risultato non può essere più significativo di un altro; i tuoi campioni, ad esempio, provengono dalla …
Sto leggendo un articolo molto interessante di Seller e Shmueli sui modelli di regressione per i dati di conteggio. Quasi all'inizio (p. 944) citano McCullaugh e Nelder (1989) affermando che la regressione binomiale negativa è impopolare e ha un problematico collegamento canonico. Ho trovato il passaggio indicato e dice (p. …
Johansson (2011) in " Salve l'impossibile: valori p, prove e probabilità " (qui c'è anche un link al diario ) afferma che valori inferiori sono spesso considerati prove più forti contro il nulla. Johansson implica che le persone considererebbero le prove contro il nulla più forti se il loro test …
"Apprendimento profondo" è solo un altro termine per la modellazione multilivello / gerarchica? Ho molta più familiarità con il secondo rispetto al primo, ma da quello che posso dire, la differenza principale non è nella loro definizione, ma nel modo in cui vengono utilizzati e valutati nel loro dominio di …
In un set di dati di due popolazioni non sovrapposte (pazienti e sani, totale ), vorrei trovare (su variabili indipendenti) predittori significativi per una variabile dipendente continua. La correlazione tra predittori è presente. Sono interessato a scoprire se qualcuno dei predittori è correlato alla variabile dipendente "in realtà" (piuttosto che …
Quali sono alcune linee guida utili per testare i parametri (ad es. Profondità di interazione, minchild, frequenza di campionamento, ecc.) Usando GBM? Diciamo che ho 70-100 funzioni, una popolazione di 200.000 e ho intenzione di testare la profondità di interazione di 3 e 4. Chiaramente ho bisogno di fare alcuni …
Molto è stato scritto in merito alle scelte cromatiche compatibili con i non vedenti per mappe, poligoni e regioni ombreggiate in generale (vedere ad esempio http://colorbrewer2.org ). Non sono stato in grado di trovare consigli per i colori delle linee e lo spessore delle linee variabili per i grafici a …
/ modifica: ulteriori follow-up ora è possibile utilizzare irlba :: prcomp_irlba / modifica: follow-up sul mio post. irlbaora ha argomenti "center" e "scale", che ti permettono di usarlo per calcolare i componenti principali, ad esempio: pc <- M %*% irlba(M, nv=5, nu=0, center=colMeans(M), right_only=TRUE)$v Ho una vasta gamma Matrixdi funzioni …
In questo articolo , la talentuosa ricercatrice Cosma Shalizi sostiene che per accettare pienamente una visione soggettiva bayesiana, si deve anche accettare un risultato non fisico secondo cui la freccia del tempo (data dal flusso di entropia) dovrebbe effettivamente tornare indietro . Questo è principalmente un tentativo di argomentare contro …
Questa domanda è stata posta dal mio amico che non è esperto di Internet. Non ho un background statistico e ho cercato su Internet questa domanda. La domanda è: è possibile sostituire i valori anomali con un valore medio? se è possibile, ci sono riferimenti / riviste di libri per …
Nel mio lavoro, stiamo confrontando le classifiche previste con le classifiche vere per alcune serie di dati. Fino a poco tempo fa usavamo Kendall-Tau da solo. Un gruppo che sta lavorando a un progetto simile ha suggerito di provare a usare invece il Gamma Goodman-Kruskal e che lo hanno preferito. …
Le comuni procedure di selezione delle variabili basate su dati (ad esempio, avanti, indietro, per gradi, tutti i sottoinsiemi) tendono a produrre modelli con proprietà indesiderate, tra cui: Coefficienti distorti da zero. Errori standard troppo piccoli e intervalli di confidenza troppo stretti. Testare statistiche e valori p che non hanno …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.