Perché i generatori di numeri casuali come runif()in R non generano sempre lo stesso risultato? Per esempio: X <- runif(100) X sta generando output diversi ogni volta. Qual è il motivo per generare output diversi ogni volta? Quali funzionalità ha in background per farlo?
Sono un nuovo arrivato nel machine learning (anche alcune statistiche), sto imparando le conoscenze (algoritmi di apprendimento supervisionato / non supervisionato, metodi di ottimizzazione pertinenti, regolarizzazioni, alcune filosofie (come il trade-off di bias-varianza?)) Per un po '. So che senza alcuna pratica reale, non otterrei una profonda comprensione di queste …
Ho trovato un tutorial molto utile per quanto riguarda l' algoritmo EM . L'esempio e l'immagine del tutorial sono semplicemente geniali. Domanda correlata sul calcolo delle probabilità come funziona la massimizzazione delle aspettative? Ho un'altra domanda su come collegare la teoria descritta nell'esercitazione all'esempio. gtgtg_tlogP( x ; Θ )logP(x;Θ)\log P(x;\Theta)gt( …
Esiste un modo numericamente stabile per calcolare i valori di una distribuzione beta per numeri interi grandi alpha, beta (ad esempio alpha, beta> 1000000)? In realtà, ho solo bisogno di un intervallo di confidenza del 99% attorno alla modalità, se ciò in qualche modo semplifica il problema. Aggiungi : mi …
Sto cercando di implementare l'algoritmo Nelder-Mead per ottimizzare una funzione. La pagina di Wikipedia su Nelder-Mead è sorprendentemente chiara sull'intero algoritmo, ad eccezione del suo criterio di arresto. Lì dice tristemente: Verificare la convergenza [chiarimento necessario] . Ho provato e testato un paio di criteri me stesso: Fermati se dove …
Ho letto un po 'su come potenziare gli algoritmi per le attività di classificazione e Adaboost in particolare. Capisco che lo scopo di Adaboost è quello di prendere diversi "discenti deboli" e, attraverso una serie di iterazioni sui dati di allenamento, spingere i classificatori a imparare a prevedere le classi …
Se ho una topologia fissa non ricorrente (DAG) (set fisso di nodi e bordi, ma l'algoritmo di apprendimento può variare il peso sui bordi) dei neuroni sigmoidi con neuroni di input che possono prendere solo stringhe in come input e porta a un output (che genera un valore reale che …
Disclaimer: ho pubblicato questa domanda su StackOverflow, ma ho pensato che forse fosse più adatto a questa piattaforma. Come testate la vostra implementazione k-mean per set di dati multidimensionali? Stavo pensando di eseguire un'implementazione già esistente (cioè Matlab) sui dati e confrontare i risultati con il mio algoritmo. Ma ciò …
Il modo classico di analisi dei componenti principali (PCA) è quello di farlo su una matrice di dati di input le cui colonne hanno media zero (quindi il PCA può "massimizzare la varianza"). Ciò può essere ottenuto facilmente centrando le colonne. Tuttavia, quando la matrice di input è sparsa, la …
Contesto: sto sviluppando un sistema che analizza i dati clinici per filtrare i dati non plausibili che potrebbero essere errori di battitura. Quello che ho fatto finora: Per quantificare la plausibilità, il mio tentativo finora è stato di normalizzare i dati e quindi calcolare un valore di plausibilità per il …
Questi sono i miei dati di allenamento: 200.000 esempi x 10.000 funzioni. Quindi la mia matrice di dati di allenamento è - 200.000 x 10.000. Sono riuscito a salvarlo in un file flat senza problemi di memoria salvando ogni set di dati uno per uno (un esempio dopo l'altro) mentre …
Chiuso. Questa domanda è fuori tema . Al momento non accetta risposte. Vuoi migliorare questa domanda? Aggiorna la domanda in modo che sia in argomento per Cross Validated. Chiuso 2 anni fa . Il mio obiettivo: Mi piacerebbe avere una funzione che accetta un indirizzo e-mail e genera un numero …
Ho un insieme di elementi che posso descrivere in base a caratteristiche. Così:XXXnnn Xio: { cI 1, cio 2, ... , cio n} ∣ xio∈ XXio:{cio1,cio2,...,cion}|Xio∈Xx_i: \{c_{i1}, c_{i2}, \ldots, c_{in}\} \mid x_i \in X dove è la valutazione (numerica) per l'elemento secondo le caratteristiche . Quindi i miei elementi possono …
Mi sono imbattuto nel seguente problema di simulazione: dato un set di numeri reali noti, una distribuzione su è definita da dove indica la parte positiva di . Mentre riesco a pensare a un campionatore Metropolis-Hastings che prende di mira questa distribuzione, mi chiedo se esiste un campionatore diretto efficiente, …
Ho bisogno di un algoritmo per campionare una distribuzione multinomiale troncata. Questo è, X⃗ ∼ 1ZpX11... pXKKX1! ... xK!x→∼1Zp1x1…pkxkx1!…xk!\vec x \sim \frac{1}{Z} \frac{p_1^{x_1} \dots p_k^{x_k}}{x_1!\dots x_k!} dove è una costante di normalizzazione, ha componenti positivi e . Considero solo i valori di nell'intervallo .→ x k ∑ x i = …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.