Domande e risposte per le persone interessate alle statistiche, all'apprendimento automatico, all'analisi dei dati, al data mining e alla visualizzazione dei dati
La differenza nelle differenze è stata a lungo popolare come strumento non sperimentale, specialmente in economia. Qualcuno può fornire una risposta chiara e non tecnica alle seguenti domande sulle differenze nelle differenze. Che cos'è uno stimatore della differenza in differenza? Perché è utile uno stimatore della differenza in differenza? Possiamo …
In parole povere un valore p dà una probabilità del risultato osservato di un esperimento data l'ipotesi (modello). Avendo questa probabilità (valore p) vogliamo giudicare la nostra ipotesi (quanto è probabile). Ma non sarebbe più naturale calcolare la probabilità dell'ipotesi dato il risultato osservato? Più in dettaglio. Abbiamo una moneta. …
Mi sto insegnando sull'apprendimento per rinforzo e sto cercando di capire il concetto di premio scontato. Quindi la ricompensa è necessaria per dire al sistema quali coppie stato-azione sono buone e quali sono cattive. Ma quello che non capisco è perché è necessario il premio scontato. Perché dovrebbe importare se …
Di recente mi sono imbattuto in questa identità: E[E(Y|X,Z)|X]=E[Y|X]E[E(Y|X,Z)|X]=E[Y|X]E \left[ E \left(Y|X,Z \right) |X \right] =E \left[Y | X \right] Ho ovviamente familiarità con la versione più semplice di quella regola, ovvero che ma non sono riuscito a trovare la giustificazione per la sua generalizzazione.E[E(Y|X)]=E(Y)E[E(Y|X)]=E(Y)E \left[ E \left(Y|X \right) \right]=E …
Attualmente sto scrivendo un documento con diverse analisi di regressione multipla. Mentre visualizzare la regressione lineare univariata è facile tramite grafici a dispersione, mi chiedevo se esiste un buon modo per visualizzare regressioni lineari multiple? Attualmente sto solo tramando grafici a dispersione come variabile dipendente vs. prima variabile indipendente, quindi …
Quando leggo "media mobile" in relazione a una serie temporale, penso a qualcosa come , o forse un peso media come . (Mi rendo conto che questi sono in realtà modelli AR (3), ma sono quelli a cui il mio cervello salta.) Perché i modelli MA (q) sono formule di …
Ok, questa è una domanda che mi tiene sveglio la notte. La procedura bootstrap può essere interpretata come approssimativa di una procedura bayesiana (ad eccezione del bootstrap bayesiano)? Mi piace molto l '"interpretazione" bayesiana delle statistiche che trovo ben coerente e di facile comprensione. Tuttavia, ho anche un punto debole …
La mia domanda riguarda il tentativo di giustificare un metodo ampiamente utilizzato, vale a dire prendere il valore atteso della serie Taylor. Supponiamo di avere una variabile casuale con media positiva e varianza . Inoltre, abbiamo una funzione, diciamo, .XXXμμ\muσ2σ2\sigma^2log(x)log(x)\log(x) Facendo l'espansione di Taylor di intorno alla media, otteniamo dove, …
Sono nuovo del data mining e sto cercando di formare un albero decisionale su un set di dati che è altamente sbilanciato. Tuttavia, sto riscontrando problemi con scarsa precisione predittiva. I dati sono costituiti dagli studenti che studiano i corsi e la variabile di classe è lo stato del corso …
Sto pensando di costruire un modello che preveda un rapporto , dove e e . Quindi, il rapporto sarebbe tra e .a ≤ b a > 0 b > 0 0 1a/ba/ba/ba≤ba≤ba \le ba>0a>0a > 0b>0b>0b > 0000111 Potrei usare la regressione lineare, sebbene non si limiti naturalmente a 0..1. …
La regolarizzazione usando metodi come Ridge, Lasso, ElasticNet è abbastanza comune per la regressione lineare. Volevo sapere quanto segue: questi metodi sono applicabili per la regressione logistica? In tal caso, esistono differenze nel modo in cui devono essere utilizzate per la regressione logistica? Se questi metodi non sono applicabili, come …
Qualcuno può spiegare cosa fanno le unità maxout in una rete neurale? Come si comportano e in che cosa differiscono dalle unità convenzionali? Ho provato a leggere il documento "Maxout Network" del 2013 di Goodfellow et al. (dal gruppo del professor Yoshua Bengio), ma non capisco bene.
Qual è la differenza principale tra la stima della massima verosimiglianza (MLE) rispetto alla stima dei minimi quadrati (LSE)? Perché non possiamo usare MLE per predire i valori nella regressione lineare e viceversa?yyy Qualsiasi aiuto su questo argomento sarà molto apprezzato.
Uso principalmente la "distribuzione gaussiana" nel mio libro, ma qualcuno mi ha appena suggerito di passare alla "distribuzione normale". Qualche consenso su quale termine usare per i principianti? Naturalmente i due termini sono sinonimi , quindi questa non è una domanda sulla sostanza, ma semplicemente una questione di quale termine …
Quali sono i motivi teorici per non gestire i valori mancanti? Macchine a gradiente, gli alberi di regressione gestiscono i valori mancanti. Perché Random Forest non lo fa?
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.