Domande e risposte per le persone interessate alle statistiche, all'apprendimento automatico, all'analisi dei dati, al data mining e alla visualizzazione dei dati
I dati per alcuni tipi di variabili tendono a non essere normali se misurati in particolari popolazioni (ad es. Livelli di depressione in una popolazione di persone con Disturbo Depressivo Maggiore). Dato che Pearson assume la normalità, quanto è solida la statistica test in condizioni di non normalità? Ho un …
Sto usando la quarta 1/4trasformazione di potenza root ( ) sulla mia variabile di risposta, a causa dell'eteroscedasticità. Ma ora non sono sicuro di come interpretare i miei coefficienti di regressione. Presumo che avrei bisogno di portare i coefficienti alla quarta potenza quando mi trasformo indietro (vedi sotto l'output di …
Ho usato l'imputazione multipla per ottenere un numero di set di dati completati. Ho usato i metodi bayesiani su ciascuno dei set di dati completati per ottenere distribuzioni posteriori per un parametro (un effetto casuale). Come posso combinare / raggruppare i risultati per questo parametro? Più contesto: Il mio modello …
Sono stato convocato per il dovere di giuria. Sono consapevole dell'importanza delle statistiche per alcuni processi con giuria. Ad esempio, il concetto di "tasso base" e la sua applicazione ai calcoli di probabilità sono talvolta - forse sempre - rilevanti. Quali argomenti statistici una persona nella mia situazione potrebbe utilmente …
Supponiamo che io abbia 20 topi. Ho accoppiato i topi in qualche modo, in modo da ottenere 10 coppie. Ai fini di questa domanda, potrebbe essere un accoppiamento casuale, O potrebbe essere un accoppiamento sensato, come cercare di accoppiare topi della stessa cucciolata, dello stesso sesso, con peso simile, O …
Ho 10 anni di dati sui rendimenti giornalieri per 28 valute diverse. Desidero estrarre il primo componente principale, ma piuttosto che far funzionare PCA per tutti i 10 anni, desidero aprire nuovamente una finestra di 2 anni, perché i comportamenti delle valute si evolvono e quindi desidero riflettere questo. Tuttavia …
Ho difficoltà a generare una serie di serie temporali colorate stazionarie, data la loro matrice di covarianza (densità di potenza spettrale (PSD) e densità spettrale di potenza incrociata (CSD)). So che, date due serie temporali e , posso stimare la loro densità spettrale di potenza (PSD) e densità spettrale incrociata …
Ho alcuni dati in [0,1] che vorrei analizzare con una regressione beta. Ovviamente bisogna fare qualcosa per accogliere i valori di 0,1. Non mi piace modificare i dati per adattarli a un modello. inoltre non credo che l'inflazione zero e 1 sia una buona idea perché credo che in questo …
Ho un paio di domande rapide su PCA: Il PCA presume che il set di dati sia gaussiano? Cosa succede quando applico un PCA a dati intrinsecamente non lineari? Dato un set di dati, il processo consiste innanzitutto nel normalizzare la media, impostare la varianza su 1, prendere un SVD, …
Ho imparato a conoscere le statistiche bayesiane e ho letto spesso negli articoli "adottiamo un approccio bayesiano" o qualcosa di simile. Ho anche notato, meno spesso: "adottiamo un approccio completamente bayesiano" (la mia enfasi). C'è qualche differenza tra questi approcci in senso pratico o teorico? FWIW, sto usando il pacchetto …
Un metodo ingenuo per approssimare una distribuzione normale è quello di sommare forse variabili IID casuali distribuite uniformemente su , quindi più recenti e ridimensionare, basandosi sul Teorema del limite centrale. ( Nota a margine : esistono metodi più accurati come la trasformazione di Box – Muller .) La somma …
Vorrei capire come generare intervalli di previsione per le stime di regressione logistica. Mi è stato consigliato di seguire le procedure in Collett's Modeling Binary Data , 2nd Ed p. 98-99. Dopo aver implementato questa procedura e confrontandola con le R predict.glm, penso davvero che questo libro mostri la procedura …
Ho costruito un indice di capitale sociale usando la tecnica PCA. Questo indice comprende valori sia positivi che negativi. Voglio trasformare / convertire questo indice in scala 0-100 per facilitarne l'interpretazione. Per favore, suggeriscimi un modo più semplice per farlo.
Ho letto varie dichiarazioni (apparentemente) contraddittorie sul fatto che AdaBoost (o altre tecniche di potenziamento) siano meno o più inclini al sovralimentazione rispetto ad altri metodi di apprendimento. Ci sono buoni motivi per credere l'uno o l'altro? Se dipende, da cosa dipende? Quali sono i motivi per cui AdaBoost è …
Per favore, prova che se abbiamo due variabili (uguale dimensione del campione) e e la varianza in è maggiore rispetto a , allora anche la somma delle differenze al quadrato (cioè, distanze euclidee quadrate) tra i punti di dati all'interno di è maggiore di che entro .Y X Y X …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.