Domande e risposte per le persone interessate alle statistiche, all'apprendimento automatico, all'analisi dei dati, al data mining e alla visualizzazione dei dati
Qual è un grafico appropriato per illustrare la relazione tra due variabili ordinali? Alcune opzioni che mi vengono in mente: Grafico a dispersione con jitter casuale aggiunto per fermare i punti che si nascondono l'un l'altro. Apparentemente un grafico standard - Minitab lo definisce un "diagramma di valori individuali". Secondo …
Supponiamo che X∼N2(μ,Σ)X∼N2(μ,Σ)\mathbf{X} \sim N_{2}(\mathbf{\mu}, \mathbf{\Sigma}) . Quindi la distribuzione condizionale di X1X1X_1 dato che X2=x2X2=x2X_2 = x_2 è multivariato normalmente distribuito con media: E[P(X1|X2=x2)]=μ1+σ12σ22(x2−μ2)E[P(X1|X2=x2)]=μ1+σ12σ22(x2−μ2) E[P(X_1 | X_2 = x_2)] = \mu_1+\frac{\sigma_{12}}{\sigma_{22}}(x_2-\mu_2) and variance: Var[P(X1|X2=x2)]=σ11−σ212σ22Var[P(X1|X2=x2)]=σ11−σ122σ22{\rm Var}[P(X_1 | X_2 = x_2)] = \sigma_{11}-\frac{\sigma_{12}^{2}}{\sigma_{22}} It makes sense that the variance would decrease …
Ho appena iniziato l'autoapprendimento nell'analisi delle serie storiche. Ho notato che ci sono un certo numero di potenziali insidie che non sono applicabili alle statistiche generali. Quindi, basandoci su quali sono i peccati statistici comuni? , Mi piacerebbe chiedere: Quali sono le insidie comuni o i peccati statistici nell'analisi delle …
Esempio di Stein mostra che la probabilità stima massimo di nnn variabili normalmente distribuite con mezzi μ1,…,μnμ1,…,μn\mu_1,\ldots,\mu_n e varianze 111 è inammissibile (sotto una funzione di perdita quadrato) sse n≥3n≥3n\ge 3 . Per una chiara dimostrazione, vedi il primo capitolo dell'Inferenza su larga scala: metodi di Bayes empirici per la …
Mi chiedevo, date due distribuzioni normali con eσ1, μ 1σ1, μ1\sigma_1,\ \mu_1σ2, μ 2σ2, μ2\sigma_2, \ \mu_2 come posso calcolare la percentuale di regioni sovrapposte di due distribuzioni? Suppongo che questo problema abbia un nome specifico, sei a conoscenza di qualche nome particolare che descriva questo problema? Sei a conoscenza …
La scrittura di Christopher Manning sulla regressione logistica in R mostra una regressione logistica in R come segue: ced.logr <- glm(ced.del ~ cat + follows + factor(class), family=binomial) Alcuni output: > summary(ced.logr) Call: glm(formula = ced.del ~ cat + follows + factor(class), family = binomial("logit")) Deviance Residuals: Min 1Q Median …
Come può essere utile un modello di regressione se non si conosce la funzione per cui si sta tentando di ottenere i parametri? Ho visto una ricerca che diceva che le madri che allattavano al seno i loro bambini avevano meno probabilità di soffrire di diabete in età avanzata. La …
Che cosa è esattamente la matrice di contrasto (un termine, pertinente ad un'analisi con predittori categorici) e come viene specificata esattamente la matrice di contrasto? Cioè cosa sono le colonne, quali sono le righe, quali sono i vincoli su quella matrice e cosa significano i numeri nelle colonne je nelle …
In un recente post sul blog di Rong Ge, si diceva che: Si ritiene che per molti problemi tra cui l'apprendimento di reti profonde, quasi tutti i minimi locali abbiano un valore di funzione molto simile all'ottimale globale, e quindi trovare un minimo locale è abbastanza buono. Da dove viene …
Ho problemi a derivare la formula della divergenza KL ipotizzando due distribuzioni normali multivariate. Ho fatto il caso univariato abbastanza facilmente. Tuttavia, è passato un po 'di tempo da quando ho preso le statistiche matematiche, quindi ho qualche problema ad estenderlo al caso multivariato. Sono sicuro che mi manca qualcosa …
Ad esempio, ho dati storici sulle perdite e sto calcolando quantili estremi (valore a rischio o probabile perdita massima). I risultati ottenuti sono per stimare la perdita o prevederli? Dove si può tracciare la linea? Sono confuso.
Mi chiedo se ci sono pacchetti per Python in grado di eseguire analisi di sopravvivenza. Ho usato il pacchetto di sopravvivenza in R ma vorrei trasferire il mio lavoro su Python.
Qual è la differenza tra "Normalizzazione" dei dati e "Ridimensionamento" dei dati? Fino ad ora ho pensato che entrambi i termini si riferissero allo stesso processo, ma ora mi rendo conto che c'è qualcosa di più che non conosco / capisco. Inoltre, se esiste una differenza tra normalizzazione e ridimensionamento, …
Mi chiedo se fa differenza nell'interpretazione se solo le variabili dipendenti, dipendenti e indipendenti, o solo le variabili indipendenti, vengono trasformate in log. Considera il caso di log(DV) = Intercept + B1*IV + Error Posso interpretare il IV come l'aumento percentuale, ma come cambia quando lo faccio log(DV) = Intercept …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.