Domande e risposte per le persone interessate alle statistiche, all'apprendimento automatico, all'analisi dei dati, al data mining e alla visualizzazione dei dati
Qual è la differenza tra il test Kwiatkowski – Phillips – Schmidt – Shin (KPSS) e il test Dickey-Fuller (ADF) aumentato? Stanno testando la stessa cosa? O dobbiamo usarli in diverse situazioni?
Qual è la differenza di significato tra la notazione e che sono comunemente usati in molti libri e documenti?P(z;d,w)P(z;d,w)P(z;d,w)P(z|d,w)P(z|d,w)P(z|d,w)
Durante l'addestramento di reti neurali a segmentazione di pixel, come reti convoluzionali, come si decide di utilizzare la funzione di perdita tra entropia e la funzione di perdita a coefficiente di dadi? Mi rendo conto che questa è una domanda breve, ma non sono del tutto sicuro di quali altre …
Merkle & Steyvers (2013) scrivono: Per definire formalmente una regola di punteggio adeguata, sia una previsione probabilistica di una prova di Bernoulli d con probabilità di successo reale p . Le regole di punteggio corrette sono metriche i cui valori previsti sono ridotti al minimo se f = p .fffdddpppf= …
Non sono sicuro che questa domanda appartenga qui, ma è strettamente correlata ai metodi di gradiente nell'ottimizzazione, che qui sembra essere in argomento. Ad ogni modo, sentiti libero di migrare se ritieni che un'altra comunità abbia una migliore esperienza in materia. In breve, sto cercando un esempio dettagliato della differenziazione …
Sto cercando di capire un documento sulla previsione del carico elettrico ma sto lottando con i concetti all'interno, in particolare il modello SARIMAX . Questo modello viene utilizzato per prevedere il carico e utilizza molti concetti statistici che non capisco (sono uno studente di informatica - mi puoi considerare un …
Supponiamo di voler fare una regressione per l' f = x * yutilizzo semplice di una rete neurale profonda standardizzata. Ricordo che ci sono delle ricerche che dicono che NN con uno strato hiden può apoximare qualsiasi funzione, ma ho provato e senza normalizzazione NN non è stato in grado …
Diciamo che abbiamo un classificatore SVM, come possiamo generare la curva ROC? (Come in teoria) (perché generiamo TPR e FPR con ciascuna soglia). E come possiamo determinare la soglia ottimale per questo classificatore SVM?
Che cos'è uno studio sull'ablazione? E c'è un modo sistematico per eseguirlo? Ad esempio, ho predittori in una regressione lineare che chiamerò come modello.nnn Come eseguirò uno studio di ablazione a questo? Quali metriche dovrei usare? Una fonte completa o un libro di testo sarebbe apprezzato.
Ci sono molti post su questo SE che discutono di solidi approcci all'analisi dei componenti principali (PCA), ma non riesco a trovare una sola buona spiegazione del perché il PCA sia sensibile agli outlier in primo luogo.
La premessa è questa citazione dalla vignetta del pacchetto R betareg1 . Inoltre, il modello condivide alcune proprietà (come predittore lineare, funzione di collegamento, parametro di dispersione) con modelli lineari generalizzati (GLM; McCullagh e Nelder 1989), ma non è un caso speciale di questo framework (nemmeno per dispersione fissa ) …
Ho letto qui il seguente: Le uscite Sigmoid non sono centrate sullo zero . Ciò è indesiderabile poiché i neuroni nei livelli successivi di elaborazione in una rete neurale (ne parleremo presto) riceveranno dati che non sono centrati sullo zero. Ciò ha implicazioni sulla dinamica durante la discesa del gradiente, …
Mi dispiace se questo è stato risposto altrove, non sono stato in grado di trovarlo. Mi chiedo perché prendiamo la radice quadrata , in particolare, della varianza per creare la deviazione standard? Cosa significa prendere la radice quadrata che produce un valore utile?
Attualmente sto studiando lezione di inferenza statistica su Coursera. In uno dei compiti, viene visualizzata la seguente domanda. | Suppose you rolled the fair die twice. What is the probability of rolling the same number two times in a row? 1: 2/6 2: 1/36 3: 0 4: 1/6 Selection: 2 …
Sono abbastanza nuovo nelle statistiche bayesiane e mi sono imbattuto in una misura di correlazione corretta, SparCC , che utilizza il processo Dirichlet nel backend del suo algoritmo. Ho provato ad analizzare l'algoritmo passo dopo passo per capire davvero cosa sta succedendo, ma non sono sicuro di cosa alphafaccia esattamente …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.