Statistiche e Big Data

Domande e risposte per le persone interessate alle statistiche, all'apprendimento automatico, all'analisi dei dati, al data mining e alla visualizzazione dei dati

4
Come creare una matrice di covarianza arbitraria
Ad esempio, in R, la MASS::mvrnorm()funzione è utile per generare dati per dimostrare varie cose nelle statistiche. Prende un Sigmaargomento obbligatorio che è una matrice simmetrica che specifica la matrice di covarianza delle variabili. Come potrei creare una matrice simmetrica con voci arbitrarie?n×nn×nn\times n



1
lme () e lmer () che danno risultati contrastanti
Ho lavorato con alcuni dati che hanno alcuni problemi con misurazioni ripetute. In tal modo ho notato un comportamento molto diverso tra lme()e lmer()utilizzando i miei dati di test e voglio sapere perché. Il set di dati falsi che ho creato ha misurazioni di altezza e peso per 10 soggetti, …

3
Trovare un modo per simulare numeri casuali per questa distribuzione
Sto cercando di scrivere un programma in R che simula numeri pseudo casuali da una distribuzione con la funzione di distribuzione cumulativa: F(x)=1−exp(−ax−bp+1xp+1),x≥0F(x)=1−exp⁡(−ax−bp+1xp+1),x≥0F(x)= 1-\exp \left(-ax-\frac{b}{p+1}x^{p+1}\right), \quad x \geq 0 dove a,b>0,p∈(0,1)a,b>0,p∈(0,1)a,b>0, p \in (0,1) Ho provato il campionamento della trasformata inversa ma l'inverso non sembra risolvibile dal punto di vista …

2
Perché la funzione softmax viene utilizzata per calcolare le probabilità sebbene possiamo dividere ciascun valore per la somma del vettore?
L'applicazione della funzione softmax su un vettore produrrà "probabilità" e valori compresi tra e . 000111 Ma possiamo anche dividere ogni valore per la somma del vettore e questo produrrà probabilità e valori tra e .000111 Ho letto la risposta qui, ma dice che il motivo è perché è differenziabile, …

2
FPR (tasso di falsi positivi) vs FDR (tasso di scoperta falsi)
La seguente citazione proviene dal famoso documento di ricerca Significato statistico per gli studi su tutto il genoma di Storey & Tibshirani (2003): Ad esempio, un tasso di falsi positivi del 5% significa che in media il 5% delle caratteristiche veramente nulle nello studio sarà chiamato significativo. Un FDR (False …

9
Overfitting e underfitting
Ho fatto alcune ricerche su overfitting e underfitting e ho capito esattamente cosa sono, ma non riesco a trovare le ragioni. Quali sono i motivi principali per eccesso e insufficiente? Perché affrontiamo questi due problemi nella formazione di un modello?





3
Comprensione del parametro input_shape in LSTM con Keras
Sto cercando di usare l'esempio descritto nella documentazione di Keras denominata "Stacked LSTM per la classificazione delle sequenze" (vedere il codice seguente) e non riesco a capire il input_shapeparametro nel contesto dei miei dati. Ho come input una matrice di sequenze di 25 possibili caratteri codificati in numeri interi in …
20 lstm  keras  shape  dimensions 



Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.