Statistiche e Big Data

Domande e risposte per le persone interessate alle statistiche, all'apprendimento automatico, all'analisi dei dati, al data mining e alla visualizzazione dei dati




5
Il fatto che mio figlio italiano frequenterà una scuola elementare cambierà il numero previsto di bambini italiani presenti nella sua classe?
Questa è una domanda derivante da una situazione di vita reale, per la quale sono stato sinceramente perplesso sulla sua risposta. Mio figlio dovrebbe iniziare la scuola elementare a Londra. Dato che siamo italiani, ero curioso di sapere quanti bambini italiani stavano già frequentando la scuola. Ho chiesto questo al …

2
Intervallo di predizione per il modello di effetti misti lmer () in R
Voglio ottenere un intervallo di previsione attorno a una previsione da un modello lmer (). Ho trovato alcune discussioni su questo: http://rstudio-pubs-static.s3.amazonaws.com/24365_2803ab8299934e888a60e7b16113f619.html http://glmm.wikidot.com/faq ma sembrano non tenere conto dell'incertezza degli effetti casuali. Ecco un esempio specifico. Sto correndo pesce d'oro. Ho dei dati sulle ultime 100 gare. Voglio prevedere il …


1
Perché glmer non raggiunge la massima probabilità (come verificato applicando un'ulteriore ottimizzazione generica)?
Derivare numericamente gli MLE di GLMM è difficile e, in pratica, lo so, non dovremmo usare l'ottimizzazione della forza bruta (ad esempio, usando optimin modo semplice). Ma per il mio scopo educativo, voglio provarlo per assicurarmi di capire correttamente il modello (vedi il codice qui sotto). Ho scoperto che ottengo …

3
Confronto tra SVM e regressione logistica
Qualcuno può darmi qualche intuizione su quando scegliere SVM o LR? Voglio capire l'intuizione dietro qual è la differenza tra i criteri di ottimizzazione dell'apprendimento dell'iperpiano dei due, in cui i rispettivi obiettivi sono i seguenti: SVM: prova a massimizzare il margine tra i vettori di supporto più vicini LR: …







3
SVM, Overfitting, maledizione della dimensionalità
Il mio set di dati è piccolo (120 campioni), tuttavia il numero di funzionalità è grande varia da (1000-200.000). Anche se sto facendo la selezione delle funzionalità per scegliere un sottoinsieme di funzionalità, potrebbe comunque essere troppo adatto. La mia prima domanda è: in che modo SVM gestisce l'overfitting, se …

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.