Statistiche e Big Data

Domande e risposte per le persone interessate alle statistiche, all'apprendimento automatico, all'analisi dei dati, al data mining e alla visualizzazione dei dati



3
L'ordine delle variabili esplicative è importante per il calcolo dei coefficienti di regressione?
All'inizio pensavo che l'ordine non avesse importanza, ma poi ho letto del processo di ortogonalizzazione di gram-schmidt per il calcolo di coefficienti di regressione multipli, e ora sto ripensandoci. Secondo il processo gram-schmidt, più tardi una variabile esplicativa viene indicizzata tra le altre variabili, più piccolo è il suo vettore …

7
Algoritmo per il monitoraggio dinamico dei quantili
Voglio stimare il quantile di alcuni dati. I dati sono così enormi che non possono essere inseriti nella memoria. E i dati non sono statici, i nuovi dati continuano ad arrivare. Qualcuno conosce qualche algoritmo per monitorare i quantili dei dati osservati finora con memoria e calcolo molto limitati? Trovo …


13
Libri di testo di econometria?
Quali buoni libri di testo di econometria consiglieresti? Modifica: ci sono alcuni libri là fuori, con vari livelli di raffinatezza matematica. Sarebbe bello avere un'idea di quanto sia tecnico il libro che stai raccomandando.



2
In che modo la CNN "12" di Krizhevsky ottiene 253.440 neuroni nel primo strato?
In Alex Krizhevsky, et al. La classificazione di Imagenet con reti neurali profonde convoluzionali enumera il numero di neuroni in ogni strato (vedi diagramma sotto). L'input della rete è di 150.528 dimensioni e il numero di neuroni negli strati rimanenti della rete è dato da 253.440–186.624–64.896–64.896–43.264– 4096–4096–1000. Una vista 3D …



4
Simula una distribuzione uniforme su un disco
Stavo tentando di simulare l'iniezione di punti casuali all'interno di un cerchio, in modo tale che qualsiasi parte del cerchio abbia la stessa probabilità di avere un difetto. Mi aspettavo che il conteggio per area della distribuzione risultante seguisse una distribuzione di Poisson se suddividessi il cerchio in rettangoli di …


7
come rappresentare la geografia o il codice postale nel modello di apprendimento automatico o nel sistema di raccomandazione?
Sto costruendo un modello e penso che la posizione geografica probabilmente sarà molto brava a prevedere la mia variabile target. Ho il codice postale di ciascuno dei miei utenti. Non sono del tutto sicuro del modo migliore per includere il codice postale come funzione predittiva nel mio modello. Sebbene il …

3
In che modo il PCA sparso è meglio del PCA?
Ho appreso della PCA alcune lezioni fa in classe e approfondendo questo affascinante concetto, ho imparato a conoscere la PCA sparsa. Volevo chiederti, se non sbaglio, questo è ciò che è un PCA scarso: in PCA, se hai punti di dati con variabili , puoi rappresentare ogni punto di dati …

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.