Domande e risposte per le persone interessate alle statistiche, all'apprendimento automatico, all'analisi dei dati, al data mining e alla visualizzazione dei dati
Un'analisi intermedia è un'analisi dei dati in uno o più punti temporali prima della chiusura ufficiale dello studio con l'intenzione, ad esempio, di terminare lo studio in anticipo. Secondo Piantadosi, S. ( Studi clinici - una prospettiva metodologica ): " La stima di un effetto del trattamento sarà distorta quando …
Il New York Times ha commentato a lungo il sistema di valutazione degli insegnanti "a valore aggiunto" utilizzato per fornire feedback agli educatori di New York City. Il lede è l'equazione usata per calcolare i punteggi - presentati senza contesto. La strategia retorica sembra essere l'intimidazione tramite la matematica: Il …
All'inizio pensavo che l'ordine non avesse importanza, ma poi ho letto del processo di ortogonalizzazione di gram-schmidt per il calcolo di coefficienti di regressione multipli, e ora sto ripensandoci. Secondo il processo gram-schmidt, più tardi una variabile esplicativa viene indicizzata tra le altre variabili, più piccolo è il suo vettore …
Voglio stimare il quantile di alcuni dati. I dati sono così enormi che non possono essere inseriti nella memoria. E i dati non sono statici, i nuovi dati continuano ad arrivare. Qualcuno conosce qualche algoritmo per monitorare i quantili dei dati osservati finora con memoria e calcolo molto limitati? Trovo …
Ho valori di p da molti test e vorrei sapere se in realtà c'è qualcosa di significativo dopo aver corretto per più test. La complicazione: i miei test non sono indipendenti. Il metodo a cui sto pensando (una variante del metodo del prodotto di Fisher, Zaykin et al., Genet Epidemiol …
Quali buoni libri di testo di econometria consiglieresti? Modifica: ci sono alcuni libri là fuori, con vari livelli di raffinatezza matematica. Sarebbe bello avere un'idea di quanto sia tecnico il libro che stai raccomandando.
"L'ora del giorno" in cui il valore può essere 0, 1, 2, ..., 23 è una variabile categoriale? Sarei tentato di dire di no, dal momento che 5, ad esempio, è "più vicino" a 4 o 6 che a 3 o 7. D'altra parte, c'è una discontinuità tra 23 e …
Vorrei capire meglio come è stata derivata la correzione di continuità alla distribuzione binomiale per l'approssimazione normale. Quale metodo è stato usato per decidere che dovremmo aggiungere 1/2 (perché non un altro numero?). Qualsiasi spiegazione (o un collegamento alla lettura suggerita, diversa da questa , sarebbe apprezzata).
In Alex Krizhevsky, et al. La classificazione di Imagenet con reti neurali profonde convoluzionali enumera il numero di neuroni in ogni strato (vedi diagramma sotto). L'input della rete è di 150.528 dimensioni e il numero di neuroni negli strati rimanenti della rete è dato da 253.440–186.624–64.896–64.896–43.264– 4096–4096–1000. Una vista 3D …
Qual è la notazione algebrica per calcolare l'intervallo di predizione per la regressione multipla? Sembra sciocco, ma ho difficoltà a trovare una chiara notazione algebrica di questo.
Sto cercando di comprendere le differenze tra i metodi di riduzione della dimensionalità lineare (ad es. PCA) e quelli non lineari (ad es. Isomap). Non riesco proprio a capire cosa implica la (non) linearità in questo contesto. Ho letto da Wikipedia che In confronto, se PCA (un algoritmo di riduzione …
Stavo tentando di simulare l'iniezione di punti casuali all'interno di un cerchio, in modo tale che qualsiasi parte del cerchio abbia la stessa probabilità di avere un difetto. Mi aspettavo che il conteggio per area della distribuzione risultante seguisse una distribuzione di Poisson se suddividessi il cerchio in rettangoli di …
Sto usando la matrice di confusione per verificare le prestazioni del mio classificatore. Sto usando Scikit-Learn, sono un po 'confuso. Come posso interpretare il risultato da from sklearn.metrics import confusion_matrix >>> y_true = [2, 0, 2, 2, 0, 1] >>> y_pred = [0, 0, 2, 2, 0, 2] >>> confusion_matrix(y_true, …
Sto costruendo un modello e penso che la posizione geografica probabilmente sarà molto brava a prevedere la mia variabile target. Ho il codice postale di ciascuno dei miei utenti. Non sono del tutto sicuro del modo migliore per includere il codice postale come funzione predittiva nel mio modello. Sebbene il …
Ho appreso della PCA alcune lezioni fa in classe e approfondendo questo affascinante concetto, ho imparato a conoscere la PCA sparsa. Volevo chiederti, se non sbaglio, questo è ciò che è un PCA scarso: in PCA, se hai punti di dati con variabili , puoi rappresentare ogni punto di dati …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.