Domande e risposte per le persone interessate alle statistiche, all'apprendimento automatico, all'analisi dei dati, al data mining e alla visualizzazione dei dati
Negli ultimi anni, le reti neurali convoluzionali (o forse le reti neurali profonde in generale) sono diventate sempre più profonde, con reti all'avanguardia che vanno da 7 strati ( AlexNet ) a 1000 strati ( reti residue) nello spazio di 4 anni. Il motivo dietro l'aumento delle prestazioni da una …
Ispirato da un commento di questa domanda : Cosa consideriamo "non informativo" in un precedente - e quali informazioni sono ancora contenute in un precedente apparentemente non informativo? In genere vedo il precedente in un'analisi in cui si tratta di un'analisi di tipo frequentista che cerca di prendere in prestito …
Anche se tutte le immagini nel set di dati MNIST sono centrate, con una scala simile e rivolte verso l'alto senza rotazioni, hanno una variazione significativa della scrittura che mi confonde come un modello lineare raggiunge una precisione di classificazione così elevata. Per quanto sono in grado di visualizzare, data …
Mi chiedo come calcolare la precisione e richiamare le misure per la classificazione multilabel multiclasse, vale a dire la classificazione in cui vi sono più di due etichette e dove ogni istanza può avere più etichette?
Nel contesto di una proposta di ricerca nelle scienze sociali, mi è stata posta la seguente domanda: Sono sempre andato di 100 + m (dove m è il numero di predittori) nel determinare la dimensione minima del campione per la regressione multipla. È appropriato? Ricevo molte domande simili, spesso con …
Contesto : non ho una formazione formale nelle statistiche bayesiane (anche se sono molto interessato a saperne di più), ma ne so abbastanza - penso - per capire il perché molti pensano che siano preferibili alle statistiche frequentiste. Anche gli studenti universitari nella classe di statistica introduttiva (nelle scienze sociali) …
Ho visto da qualche parte che le distanze classiche (come la distanza euclidea) diventano debolmente discriminanti quando abbiamo dati multidimensionali e radi. Perché? Hai un esempio di due vettori di dati sparsi in cui la distanza euclidea non funziona bene? In questo caso quale somiglianza dovremmo usare?
I tempi di attesa per la distribuzione di Poisson è una distribuzione esponenziale con parametro lambda. Ma non lo capisco. Ad esempio, Poisson modella il numero di arrivi per unità di tempo. In che modo ciò è legato alla distribuzione esponenziale? Diciamo che la probabilità di k arrivi in un'unità …
Quali sono i soliti presupposti per la regressione lineare? Includono: una relazione lineare tra la variabile indipendente e dipendente errori indipendenti normale distribuzione degli errori omoschedasticità Ce ne sono altri?
L'entropia di Shannon è il negativo della somma delle probabilità di ogni risultato moltiplicato per il logaritmo delle probabilità per ogni risultato. A quale scopo serve il logaritmo in questa equazione? Una risposta intuitiva o visiva (al contrario di una risposta profondamente matematica) riceverà punti bonus!
Stima del coefficiente di regressione della cresta sono i valori che minimizzano il valoreβ^Rβ^R\hat{\beta}^R RSS+λ∑j=1pβ2j.RSS+λ∑j=1pβj2. \text{RSS} + \lambda \sum_{j=1}^p\beta_j^2. Le mie domande sono: Se , allora vediamo che l'espressione sopra si riduce al solito RSS. E se ? Non capisco la spiegazione da manuale del comportamento dei coefficienti.λ=0λ=0\lambda = 0λ→∞λ→∞\lambda …
Nel corso di machine learning di Andrew Ng , introduce la regressione lineare e la regressione logistica e mostra come adattare i parametri del modello usando la discesa del gradiente e il metodo di Newton. So che la discesa gradiente può essere utile in alcune applicazioni dell'apprendimento automatico (ad esempio, …
Sembra che il data mining e l'apprendimento automatico siano diventati così popolari che ora quasi tutti gli studenti CS conoscono classificatori, clustering, PNL statistica ... ecc. Quindi, al giorno d'oggi, non è difficile trovare minatori di dati. La mia domanda è: quali sono le competenze che un data mining potrebbe …
Come posso rimuovere le righe duplicate da questo frame di dati di esempio? A 1 A 1 A 2 B 4 B 1 B 1 C 2 C 2 Vorrei rimuovere i duplicati in base a entrambe le colonne: A 1 A 2 B 4 B 1 C 2 L'ordine …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.