Domande e risposte per le persone interessate alle statistiche, all'apprendimento automatico, all'analisi dei dati, al data mining e alla visualizzazione dei dati
Spiegherò il mio problema con un esempio. Supponiamo di voler prevedere il reddito di un individuo in base ad alcuni attributi: {Età, Genere, Paese, Regione, Città}. Hai un set di dati di allenamento come questo train <- data.frame(CountryID=c(1,1,1,1, 2,2,2,2, 3,3,3,3), RegionID=c(1,1,1,2, 3,3,4,4, 5,5,5,5), CityID=c(1,1,2,3, 4,5,6,6, 7,7,7,8), Age=c(23,48,62,63, 25,41,45,19, 37,41,31,50), Gender=factor(c("M","F","M","F", …
Le introduzioni ai modelli grafici li descrivono come "... un matrimonio tra teoria dei grafi e teoria delle probabilità". Ottengo la parte della teoria della probabilità ma ho difficoltà a capire dove si inserisce esattamente la teoria dei grafi. Quali intuizioni della teoria dei grafi hanno contribuito ad approfondire la …
Da un lato, ho la regressione alla media e dall'altro ho l' errore del giocatore . L'errore del giocatore d'azzardo è definito da Miller e Sanjurjo (2019) come "la convinzione errata che sequenze casuali abbiano una tendenza sistematica all'inversione, cioè che le serie di risultati simili hanno più probabilità di …
Supponiamo di avere una variabile casuale X∼f(x|θ)X∼f(x|θ)X \sim f(x|\theta) . Se θ0θ0\theta_0 fosse il parametro vero, la funzione di verosimiglianza dovrebbe essere massimizzata e la derivata uguale a zero. Questo è il principio alla base dello stimatore della massima verosimiglianza. A quanto ho capito, le informazioni di Fisher sono definite …
sfondo Supponiamo di avere un modello dei minimi quadrati ordinari in cui abbiamo coefficienti nel nostro modello di regressione, kkky=Xβ+ϵy=Xβ+ϵ\mathbf{y}=\mathbf{X}\mathbf{\beta} + \mathbf{\epsilon} dove è un vettore di coefficienti , è la matrice di progettazione definita daββ\mathbf{\beta}(k×1)(k×1)(k\times1)XX\mathbf{X} X=⎛⎝⎜⎜⎜⎜⎜⎜11⋮1x11x21xn1x12…⋱………x1(k−1)⋮⋮xn(k−1)⎞⎠⎟⎟⎟⎟⎟⎟X=(1x11x12…x1(k−1)1x21…⋮⋮⋱⋮1xn1……xn(k−1))\mathbf{X} = \begin{pmatrix} 1 & x_{11} & x_{12} & \dots & x_{1\;(k-1)} \\ 1 …
Pur derivando formalmente l'intervallo di confidenza di una stima, ho finito con una formula che ricorda molto da vicino il modo in cui viene calcolato il valore .ppp Quindi la domanda: sono formalmente equivalenti? Vale a dire che rifiuta un'ipotesi con un valore critico equivalente a non appartenente all'intervallo di …
Volevo fare una dimostrazione di classe in cui ho confrontato un intervallo t con un intervallo bootstrap e ho calcolato la probabilità di copertura di entrambi. Volevo che i dati provenissero da una distribuzione distorta, quindi ho scelto di generare i dati come exp(rnorm(10, 0, 2)) + 1, un campione …
Avendo recentemente studiato il bootstrap, mi è venuta in mente una domanda concettuale che ancora mi confonde: Hai una popolazione e vuoi conoscere un attributo della popolazione, ad esempio , dove uso per rappresentare la popolazione. Questo potrebbe essere la popolazione media per esempio. Di solito non è possibile ottenere …
Ho una distribuzione osservata sperimentalmente che sembra molto simile a una distribuzione gamma o lognormale. Ho letto che la distribuzione lognormale è la distribuzione di probabilità entropia massima per una variabile casuale per la quale sono fissati la media e la varianza di . La distribuzione gamma ha proprietà simili?XXXln( …
Vorrei usare GLM e Elastic Net per selezionare quelle caratteristiche rilevanti + costruire un modello di regressione lineare (cioè sia la previsione che la comprensione, quindi sarebbe meglio rimanere con relativamente pochi parametri). L'output è continuo. Sono geni per casi. Ho letto del pacchetto, ma non sono sicuro al 100% …
Quando si prevede un valore adattato da un modello di regressione logistica, come vengono calcolati gli errori standard? Intendo per i valori adattati , non per i coefficienti (che coinvolgono la matrice di informazioni dei pescatori). Ho solo scoperto come ottenere i numeri R(ad es. Qui su r-help o qui …
È possibile per ANOVA a senso unico (con gruppi o "livelli") segnalare una differenza significativa quando nessuno dei test T a coppie fa?N ( N - 1 ) / 2N> 2N>2N>2N( N- 1 ) / 2N(N-1)/2N(N-1)/2 In questa risposta @whuber ha scritto: È noto che un test ANOVA F globale …
Sono un po 'confuso riguardo l'Area Under Curve (AUC) di ROC e l'accuratezza complessiva. L'AUC sarà proporzionale alla precisione complessiva? In altre parole, quando avremo una maggiore precisione complessiva avremo sicuramente una AUC più grande? O sono per definizione correlati positivamente? Se sono correlati positivamente, perché dovremmo preoccuparci di riportarli …
Sono un po 'confuso con la differenza tra un SVM e un percettrone. Vorrei provare a sintetizzare la mia comprensione qui, e non esitate a correggere dove sbaglio e compilare ciò che ho perso. Il Perceptron non tenta di ottimizzare la "distanza" di separazione. Finché trova un iperpiano che separa …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.