Statistiche e Big Data

Domande e risposte per le persone interessate alle statistiche, all'apprendimento automatico, all'analisi dei dati, al data mining e alla visualizzazione dei dati




8
Genera una variabile casuale con una correlazione definita con una o più variabili esistenti
Per uno studio di simulazione devo generare variabili casuali che mostrano una correlazione (popolazione) predefinita a una variabile esistente .YYY Ho esaminato i Rpacchetti copulae CDVineche possono produrre distribuzioni multivariate casuali con una determinata struttura di dipendenza. Tuttavia, non è possibile fissare una delle variabili risultanti su una variabile esistente. …

4
Come visualizzare quale analisi di correlazione canonica fa (rispetto a quale analisi di componente principale fa)?
L'analisi di correlazione canonica (CCA) è una tecnica correlata all'analisi dei componenti principali (PCA). Mentre è facile insegnare la PCA o la regressione lineare usando un diagramma a dispersione (vedere alcune migliaia di esempi sulla ricerca di immagini di Google), non ho visto un simile esempio bidimensionale intuitivo per CCA. …



9
Quali sono le principali differenze filosofiche, metodologiche e terminologiche tra econometria e altri campi statistici?
L'econometria ha una sostanziale sovrapposizione con le statistiche tradizionali, ma spesso usa il proprio gergo su una varietà di argomenti ("identificazione", "esogena", ecc.). Una volta ho sentito un professore di statistica applicata in un altro campo commentare che spesso la terminologia è diversa ma i concetti sono gli stessi. Tuttavia …


15
Pensieri pratici sulla modellistica esplicativa vs. predittiva
Ad aprile, ho partecipato a un discorso alla serie di seminari sul gruppo di statistiche del Dipartimento di matematica UMD intitolata "Spiegare o predire?". Il discorso è stato tenuto dal Prof. Galit Shmueli che insegna alla Smith Business School dell'UMD . Il suo intervento si basava sulla ricerca che aveva …

9
Quale algoritmo dovrei usare per rilevare anomalie nelle serie temporali?
sfondo Sto lavorando in Network Operations Center, monitoriamo i sistemi informatici e le loro prestazioni. Una delle metriche chiave da monitorare è un numero di visitatori / clienti attualmente connessi ai nostri server. Per renderlo visibile, noi (team Ops) raccogliamo metriche come dati di serie temporali e tracciamo grafici. La …

1
Come dividere il set di dati per la validazione incrociata, la curva di apprendimento e la valutazione finale?
Qual è una strategia appropriata per suddividere il set di dati? Chiedo feedback sul seguente approccio (non sui singoli parametri come test_sizeo n_iter, ma se usato X, y, X_train, y_train, X_test, e y_testin modo appropriato e se la sequenza senso): (estendendo questo esempio dalla documentazione di scikit-learn) 1. Caricare il …

4
Qual è la differenza tra le funzioni R prcomp e princomp?
Ho confrontato ?prcompe ?princomptrovato qualcosa sull'analisi dei componenti principali in modalità Q e modalità R (PCA). Ma onestamente, non lo capisco. Qualcuno può spiegare la differenza e forse anche spiegare quando applicare quale?
70 r  pca 

2
Come funziona il livello 'Incorporamento' di Keras?
È necessario comprendere il funzionamento del livello 'Incorporamento' nella libreria Keras. Eseguo il seguente codice in Python import numpy as np from keras.models import Sequential from keras.layers import Embedding model = Sequential() model.add(Embedding(5, 2, input_length=5)) input_array = np.random.randint(5, size=(1, 5)) model.compile('rmsprop', 'mse') output_array = model.predict(input_array) che fornisce il seguente output …

3
Perché i ricercatori delle reti neurali si preoccupano delle epoche?
Un'epoca nella discesa del gradiente stocastico è definita come un singolo passaggio attraverso i dati. Per ogni minibatch SGD, vengono estratti campioni, il gradiente calcolato e i parametri aggiornati. Nell'impostazione dell'epoca, i campioni vengono disegnati senza sostituzione.kkk Ma questo sembra inutile. Perché non disegnare ogni minibatch SGD mentre disegna casualmente …

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.