Domande e risposte per le persone interessate alle statistiche, all'apprendimento automatico, all'analisi dei dati, al data mining e alla visualizzazione dei dati
Ad esempio, in R, la MASS::mvrnorm()funzione è utile per generare dati per dimostrare varie cose nelle statistiche. Prende un Sigmaargomento obbligatorio che è una matrice simmetrica che specifica la matrice di covarianza delle variabili. Come potrei creare una matrice simmetrica con voci arbitrarie?n×nn×nn\times n
Ho due variabili che non mostrano molta correlazione quando vengono tracciate una contro l'altra così com'è, ma una relazione lineare molto chiara quando tracciamo i log di ciascuna variabile di nuovo rispetto all'altra. Quindi finirei con un modello del tipo: log(Y)=alog(X)+blog(Y)=alog(X)+b\log(Y) = a \log(X) + b , che è ottimo …
Nell'implementazione di ResNet di Tensorflow , trovo che utilizzino l'inizializzatore di ridimensionamento della varianza, trovo anche che l'inizializzatore di xavier sia popolare. Non ho troppa esperienza su questo, che è meglio in pratica?
Ho lavorato con alcuni dati che hanno alcuni problemi con misurazioni ripetute. In tal modo ho notato un comportamento molto diverso tra lme()e lmer()utilizzando i miei dati di test e voglio sapere perché. Il set di dati falsi che ho creato ha misurazioni di altezza e peso per 10 soggetti, …
Sto cercando di scrivere un programma in R che simula numeri pseudo casuali da una distribuzione con la funzione di distribuzione cumulativa: F(x)=1−exp(−ax−bp+1xp+1),x≥0F(x)=1−exp(−ax−bp+1xp+1),x≥0F(x)= 1-\exp \left(-ax-\frac{b}{p+1}x^{p+1}\right), \quad x \geq 0 dove a,b>0,p∈(0,1)a,b>0,p∈(0,1)a,b>0, p \in (0,1) Ho provato il campionamento della trasformata inversa ma l'inverso non sembra risolvibile dal punto di vista …
L'applicazione della funzione softmax su un vettore produrrà "probabilità" e valori compresi tra e . 000111 Ma possiamo anche dividere ogni valore per la somma del vettore e questo produrrà probabilità e valori tra e .000111 Ho letto la risposta qui, ma dice che il motivo è perché è differenziabile, …
La seguente citazione proviene dal famoso documento di ricerca Significato statistico per gli studi su tutto il genoma di Storey & Tibshirani (2003): Ad esempio, un tasso di falsi positivi del 5% significa che in media il 5% delle caratteristiche veramente nulle nello studio sarà chiamato significativo. Un FDR (False …
Ho fatto alcune ricerche su overfitting e underfitting e ho capito esattamente cosa sono, ma non riesco a trovare le ragioni. Quali sono i motivi principali per eccesso e insufficiente? Perché affrontiamo questi due problemi nella formazione di un modello?
Stavo facendo un po 'di lavoro in Scipy e mi è venuta una conversazione con un membro del gruppo scipy principale se una variabile casuale discreta non negativa può avere un momento indefinito. Penso che abbia ragione, ma non ho una prova a portata di mano. Qualcuno può mostrare / …
Esiste un esempio in cui due diversi test difendibili con probabilità proporzionali porterebbero a inferenze marcatamente diverse (e ugualmente difendibili), per esempio, dove i valori p sono di ordine di grandezza molto distanti, ma il potere delle alternative è simile? Tutti gli esempi che vedo sono molto sciocchi, confrontando un …
Sembra che nella probabilità quotidiana (non nella fisica quantistica), le probabilità siano in realtà solo un sostituto di uno sconosciuto. Prendi una moneta, ad esempio. Diciamo che è "casuale", un cambio di testa del 50% e una probabilità del 50% di code. Tuttavia, se conoscessi esattamente la densità, la dimensione …
Ho appena capito che ho sempre lavorato al problema della regressione in cui le variabili indipendenti erano sempre numeriche. Posso usare la regressione lineare nel caso in cui tutte le variabili indipendenti siano categoriche?
Sto cercando di usare l'esempio descritto nella documentazione di Keras denominata "Stacked LSTM per la classificazione delle sequenze" (vedere il codice seguente) e non riesco a capire il input_shapeparametro nel contesto dei miei dati. Ho come input una matrice di sequenze di 25 possibili caratteri codificati in numeri interi in …
Sto rivedendo un documento che ha eseguito> 15 test 2x2 Chi Square separati. Ho suggerito di dover correggere più confronti, ma hanno risposto affermando che tutti i confronti erano pianificati e quindi non è necessario. Penso che questo non debba essere corretto, ma non riesco a trovare risorse che affermino …
Sto eseguendo un piccolo esperimento con la regressione di LASSO in R per testare se è in grado di trovare una coppia predittiva perfetta. La coppia è definita in questo modo: f1 + f2 = risultato Il risultato qui è un vettore predeterminato chiamato 'età'. F1 e f2 vengono creati …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.