Domande e risposte per le persone interessate alle statistiche, all'apprendimento automatico, all'analisi dei dati, al data mining e alla visualizzazione dei dati
Qual è la differenza tra la distribuzione binomiale negativa e la distribuzione binomiale? Ho provato a leggere online e ho scoperto che la distribuzione binomiale negativa viene utilizzata quando i punti dati sono discreti, ma penso che anche la distribuzione binomiale possa essere utilizzata per punti dati discreti.
Vorrei raggruppare gerarchicamente i miei dati, ma piuttosto che usare la distanza euclidea, vorrei usare la correlazione. Inoltre, poiché il coefficiente di correlazione varia da -1 a 1, con -1 e 1 che indicano "coregolamentazione" nel mio studio, sto trattando sia -1 che 1 come d = 0. Quindi il …
Nell'inferenza bayesiana si ottiene una distribuzione predittiva di dati futuri integrando parametri sconosciuti; l'integrazione sulla distribuzione posteriore di tali parametri fornisce una distribuzione predittiva posteriore, una distribuzione per dati futuri subordinata a quelli già osservati. Quali metodi non bayesiani per l'inferenza predittiva ci sono che tengono conto dell'incertezza nelle stime …
Stavo esaminando la letteratura sulla regolarizzazione e spesso vedevo paragrafi che collegano la regolarizzazione L2 con il priore gaussiano e L1 con Laplace centrato su zero. So come appaiono questi priori, ma non capisco, come si traduca, ad esempio, in pesi nel modello lineare. In L1, se capisco correttamente, ci …
Esistono buoni documenti che trattano alcuni modi metodici di scegliere le dimensioni dei filtri, raggruppare le unità e determinare il numero di strati convoluzionali?
C'è stato un po 'di confusione nella mia testa riguardo a due tipi di stimatori del valore della popolazione del coefficiente di correlazione di Pearson. A. Fisher (1915) ha mostrato che per la popolazione normale bivariata empirica è un prevenuto negativamente stimatore , anche se la polarizzazione può essere di …
La maggior parte delle risorse sulle regole di punteggio adeguate menzionano una serie di regole di punteggio diverse come perdita di log, punteggio di Brier o punteggio sferico. Tuttavia, spesso non forniscono molte indicazioni sulle differenze tra loro. (Allegato A: Wikipedia .) Scegliere il modello che massimizza il punteggio logaritmico …
Come prequel di una domanda sui modelli lineari misti in R e di condividere come riferimento per gli appassionati di statistiche per principianti / intermedi, ho deciso di pubblicare come "domande e risposte" indipendenti i passaggi coinvolti nel calcolo "manuale" del coefficienti e valori previsti di una semplice regressione lineare. …
Ho letto Gli elementi dell'apprendimento statistico e non riuscivo a capire di cosa trattasse la Sezione 3.7 "Riduzione e selezione di risultati multipli". Parla di RRR (regressione di rango ridotto) e posso solo capire che la premessa riguarda un modello lineare multivariato generalizzato in cui i coefficienti sono sconosciuti (e …
Nel PCA, quando il numero di dimensioni è maggiore (o addirittura uguale a) del numero di campioni N , perché avrai al massimo N - 1 autovettori diversi da zero? In altre parole, il rango della matrice di covarianza tra le dimensioni d ≥ N è N - 1 .dddNNNN−1N−1N-1d≥Nd≥Nd\ge …
Data una matrice di covarianza ΣSΣs\boldsymbol \Sigma_s , come generare dati in modo tale da avere la matrice di covarianza di esempio Σ^= ΣSΣ^=Σs\hat{\boldsymbol \Sigma} = \boldsymbol \Sigma_s ? Più in generale: siamo spesso interessati a generare dati da una densità f( x | θ )f(x|θ) f(x \vert \boldsymbol\theta) , …
Sto cercando un case study di regressione lineare avanzato che illustri i passaggi necessari per modellare relazioni complesse e multiple non lineari utilizzando GLM o OLS. È sorprendentemente difficile trovare risorse che vadano oltre gli esempi scolastici di base: la maggior parte dei libri che ho letto non andrà oltre …
Qual è la trama migliore, dal punto di vista statistico, per mostrare una tabella di contingenza , che viene generalmente analizzata dal test chi-quadrato? È un grafico a barre schivato, grafico a barre in pila, mappa di calore, grafico di contorno, grafico a dispersione jitterred, grafico a più linee o …
Sono interessato a stimare la densità di una vc continua . Un modo per farlo che ho imparato è l'uso della stima della densità del kernel.XXX Ma ora sono interessato a un approccio bayesiano che segue le seguenti linee. Inizialmente Credo che segue una distribuzione . Prendo letture di . …
Non sono nemmeno sicuro che la domanda abbia molto senso, ma penso di aver visto un paio di titoli di articoli in cui proponevano foreste casuali con effetti casuali. È possibile in R?
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.