Una foresta casuale è una raccolta di alberi decisionali formata selezionando casualmente solo alcune funzionalità con cui costruire ciascun albero (e talvolta inserendo i dati di addestramento). Apparentemente imparano e generalizzano bene. Qualcuno ha fatto il campionamento MCMC dello spazio dell'albero decisionale o li ha confrontati con foreste casuali? So …
In genere mi occupo di dati in cui più individui vengono misurati più volte in ciascuna di 2 o più condizioni. Recentemente ho giocato con la modellazione di effetti misti per valutare l'evidenza delle differenze tra le condizioni, la modellazioneindividual come un effetto casuale. Per visualizzare l'incertezza riguardo alle previsioni …
Ho la seguente domanda per un corso a cui sto lavorando: Effettuare uno studio Monte Carlo per stimare le probabilità di copertura dell'intervallo di confidenza bootstrap normale standard e dell'intervallo di confidenza bootstrap di base. Campionare da una popolazione normale e verificare i tassi di copertura empirica per la media …
Vorrei risolvere il Progetto Euler 213 ma non so da dove cominciare perché sono un laico nel campo della Statistica, nota che è necessaria una risposta accurata, quindi il metodo Monte Carlo non funzionerà. Potresti consigliarmi alcuni argomenti statistici su cui leggere? Si prega di non pubblicare la soluzione qui. …
Una situazione estremamente comune nella computer grafica è che il colore di alcuni pixel è uguale all'integrale di alcune funzioni con valori reali. Spesso la funzione è troppo complicata per essere risolta analiticamente, quindi ci rimane un'approssimazione numerica. Ma la funzione è spesso molto costosa da calcolare, quindi siamo fortemente …
Quando un insieme di equazioni non può essere risolto analiticamente, allora possiamo usare un algoritmo di discesa gradiente. Ma sembra che ci sia anche il metodo di simulazione Monte Carlo che può essere usato per risolvere problemi che non hanno soluzioni analitiche. Come capire quando usare la discesa gradiente e …
Supponiamo che io voglia campionare da una distribuzione continua . Se ho un'espressione di nel modulop(x)p(x)p(x)ppp p(x)=∑i=1∞aifi(x)p(x)=∑i=1∞aifi(x)p(x) = \sum_{i=1}^\infty a_i f_i(x) dove e f_i sono distribuzioni da cui è possibile campionare facilmente, quindi posso facilmente generare campioni da p mediante:ai⩾0,∑iai=1ai⩾0,∑iai=1a_i \geqslant 0, \sum_i a_i= 1fifif_ippp Campionamento di un'etichetta iii con …
Attualmente sto usando un approccio bayesiano per stimare i parametri per un modello costituito da diversi ODE. Dato che ho 15 parametri da stimare, il mio spazio di campionamento è di 15 dimensioni e la mia ricerca per distribuzione posteriore sembra avere molti massimi locali che sono molto isolati da …
Sto testando l'indipendenza in una tabella di contingenzaNon so se il G-test o il test chi-quadrato di Pearson siano migliori. La dimensione del campione è in centinaia ma ci sono alcuni conteggi di celle bassi. Come indicato nella pagina di Wikipedia , l'approssimazione alla distribuzione chi-quadrata è migliore per il …
La mia domanda riguarda il numero richiesto di simulazioni per il metodo di analisi Monte Carlo. Per quanto vedo il numero richiesto di simulazioni per qualsiasi errore percentuale consentito (es. 5) è n = { 100 ⋅ z c ⋅ std ( x )EEEn = { 100 ⋅ zc⋅ std …
Sto lavorando a una funzione Monte Carlo per valutare diverse attività con rendimenti parzialmente correlati. Attualmente, ho appena generato una matrice di covarianza e mi sono nutrito con la rmvnorm()funzione in R. (Genera valori casuali correlati). Tuttavia, osservando le distribuzioni dei rendimenti di un'attività, non viene normalmente distribuita. Questa è …
Nel mio programma ho bisogno di eseguire N thread separati ciascuno con il proprio RNG che viene utilizzato per campionare un set di dati di grandi dimensioni. Devo essere in grado di seminare l'intero processo con un singolo valore in modo da poter riprodurre i risultati. È sufficiente aumentare semplicemente …
Questo è solo un esempio che ho riscontrato più volte, quindi non ho dati di esempio. Esecuzione di un modello di regressione lineare in R: a.lm = lm(Y ~ x1 + x2) x1è una variabile continua. x2è categorico e ha tre valori, ad esempio "Basso", "Medio" e "Alto". Tuttavia, l'output …
Sto cercando di capire il funzionamento interiore dell'Hamiltoniano Monte Carlo (HMC), ma non riesco a comprendere appieno la parte quando sostituiamo la deterministica integrazione temporale con una proposta di metropoli. Sto leggendo il fantastico documento introduttivo A Conceptual Introduction to Hamiltonian Monte Carlo di Michael Betancourt, quindi seguirò la stessa …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.