Quali sono i pro e i contro dell'utilizzo di LARS [1] rispetto all'utilizzo della discesa delle coordinate per l'adattamento della regressione lineare regolarizzata L1? Sono principalmente interessato agli aspetti prestazionali (i miei problemi tendono ad avere Ntra le centinaia di migliaia e p<20). Tuttavia, anche altre intuizioni sarebbero apprezzate. modifica: …
Attualmente sto lavorando come assistente di insegnamento presso la mia università, in un corso di statistica introduttiva (per studenti di medicina). Offline, ci sono molti libri disponibili con informazioni per aiutare l'insegnante. Tuttavia, ciò che mi interessa sapere è se potresti indirizzarmi verso qualsiasi (buona) risorsa che fornisca esercizi (con …
Recentemente ho imparato a conoscere le regole di punteggio adeguate per i classificatori probabilistici. Numerosi thread su questo sito Web hanno sottolineato come l'accuratezza sia una regola di punteggio impropria e non dovrebbe essere utilizzata per valutare la qualità delle previsioni generate da un modello probabilistico come la regressione logistica. …
Diciamo che sto calcolando altezze (in cm) e i numeri devono essere più alti di zero. Ecco l'elenco di esempio: 0.77132064 0.02075195 0.63364823 0.74880388 0.49850701 0.22479665 0.19806286 0.76053071 0.16911084 0.08833981 Mean: 0.41138725956196015 Std: 0.2860541519582141 In questo esempio, secondo la distribuzione normale, il 99,7% dei valori deve essere compreso tra ± …
Sono piuttosto nuovo nel campo dei processi gaussiani e di come vengono applicati nell'apprendimento automatico. Continuo a leggere e ascoltare le funzioni di covarianza come l'attrazione principale di questi metodi. Qualcuno potrebbe spiegare in modo intuitivo cosa sta succedendo in queste funzioni di covarianza? Altrimenti, se potessi segnalare un tutorial …
Nei commenti che seguono questa mia risposta a una domanda correlata, gli utenti ssdecontrol e Glen_b hanno chiesto se la normalità congiunta di e è necessaria per affermare la normalità della somma ? Che la normalità comune sia sufficiente è, ovviamente, ben noto. Questa domanda supplementare non è stata affrontata …
Sto cercando di capire la logica dietro il test chi-quadrato. Il test Chi-quadrato è . χ2viene quindi confrontato con una distribuzione Chi-quadrata per scoprire un valore p al fine di respingere o meno l'ipotesi nulla. H0: le osservazioni provengono dalla distribuzione che abbiamo usato per creare i nostri valori previsti. …
Mi è stata posta questa domanda con in un'intervista. C'è una risposta "corretta"?(n,k)=(400,220)(n,k)=(400,220)(n, k) = (400, 220) Supponiamo che i tiri siano iid e la probabilità di testa sia . La distribuzione del numero di teste in 400 lanci dovrebbe quindi essere vicina alla Normale (200, 10 ^ 2), in …
So che per la variabile continua .P[X=x]=0P[X=x]=0P[X=x]=0 Ma non riesco a visualizzare che se , c'è un numero infinito di possibili 's. E anche perché le loro probabilità diventano infinitamente piccole?xP[X=x]=0P[X=x]=0P[X=x]=0xxx
Sto studiando l'apprendimento automatico e ogni libro che apro mi imbatto in distribuzione chi-quadrato, funzione gamma, distribuzione t, gaussiana, ecc. Ogni libro che ho aperto finora definisce solo quali sono le distribuzioni: non spiegano né danno l'intuizione su da dove provengano le formule specifiche per le funzioni. Ad esempio, perché …
Nel libro "Limit Theorems of Probability Theory" di Valentin V. Petrov, ho visto una distinzione tra le definizioni di una distribuzione "continua" e "assolutamente continua", che si afferma come segue: "... Sidice che ladistribuzione della variabile casuale X è continua se P ( X ∈ B ) = 0 per …
Il teorema di Halmos-Savage afferma che per un modello statistico dominato una statistica è sufficiente se (e solo se) per tutti esiste una versione misurabile del derivato Radon Nikodym dove è un misura privilegiata tale che per e .(Ω,A,P)(Ω,A,P)(\Omega, \mathscr A, \mathscr P)T:(Ω,A,P)→(Ω′,A′)T:(Ω,A,P)→(Ω′,A′)T: (\Omega, \mathscr A, \mathscr P)\to(\Omega', \mathscr A'){P∈P}{P∈P}\{P …
Il seguente problema è stato pubblicato sulla pagina Facebook di Mensa International: \quad\quad\quad\quad\quad\quad\quad\quad Il post stesso ha ricevuto oltre 1000 commenti, ma non entrerò nei dettagli del dibattito in quanto so che questo è il paradosso del box di Bertrand e la risposta è . Ciò che mi interessa qui …
Come costruire un esempio di distribuzione di probabilità per la quale vale, assumendo ?E(1X)=1E(X)E(1X)=1E(X)\mathbb{E}\left(\frac{1}{X}\right)=\frac{1}{\mathbb{E}(X)}P(X≠0)=1P(X≠0)=1\mathbb{P}(X\ne0)=1 La disuguaglianza che deriva dalla disuguaglianza di Jensen per un RV valutato positivamente è come (la disuguaglianza inversa se ). Questo perché il mapping è convesso per e concavo per . Seguendo la condizione di uguaglianza …
Le competizioni Kaggle determinano le classifiche finali in base a un set di prove disputato. Un set di test tenuto fuori è un campione; potrebbe non essere rappresentativo della popolazione modellata. Dato che ogni invio è come un'ipotesi, l'algoritmo che ha vinto la competizione potrebbe, per caso, aver finito per …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.