Statistiche e Big Data

Domande e risposte per le persone interessate alle statistiche, all'apprendimento automatico, all'analisi dei dati, al data mining e alla visualizzazione dei dati

5
Sull'importanza dell'assunzione di iid nell'apprendimento statistico
Nell'apprendimento statistico, implicitamente o esplicitamente, si presume sempre che l'insieme di addestramento sia composto da tuple input / response che sono disegnati indipendentemente dalla stessa distribuzione congiunta conD={X,y}D={X,y}\mathcal{D} = \{ \bf {X}, \bf{y} \}NNN(Xi,yi)(Xi,yi)({\bf{X}}_i,y_i) P(X,y)P(X,y)\mathbb{P}({\bf{X}},y) p(X,y)=p(y|X)p(X)p(X,y)=p(y|X)p(X) p({\bf{X}},y) = p( y \vert {\bf{X}}) p({\bf{X}}) e la relazione che stiamo cercando di …



3
API / feed di dati disponibili come pacchetti in R
EDIT: la visualizzazione dell'attività CRAN di Web Technologies and Services contiene un elenco molto più completo di origini dati e API disponibili in R. È possibile inviare una richiesta pull su github se si desidera aggiungere un pacchetto alla visualizzazione attività. Sto facendo un elenco dei vari feed di dati …
53 r  references  dataset 

10
Apprendimento automatico tramite Python
Sto pensando di utilizzare le librerie Python per fare i miei esperimenti di Machine Learning. Finora mi ero affidato a WEKA, ma nel complesso sono rimasto piuttosto insoddisfatto. Questo principalmente perché ho trovato che WEKA non era così ben supportato (pochissimi esempi, la documentazione è scarsa e il supporto della …


6
Regressione lineare online efficiente
Sto analizzando alcuni dati in cui vorrei eseguire la regressione lineare ordinaria, tuttavia ciò non è possibile in quanto ho a che fare con un'impostazione online con un flusso continuo di dati di input (che diventerà rapidamente troppo grande per la memoria) e di cui ho bisogno per aggiornare le …

10
Misura entropia / informazioni / schemi di una matrice binaria 2d
Voglio misurare l'entropia / la densità di informazioni / la somiglianza del modello di una matrice binaria bidimensionale. Vorrei mostrare alcune immagini per chiarimenti: Questo display dovrebbe avere un'entropia piuttosto elevata: UN) Questo dovrebbe avere entropia media: B) Queste immagini, infine, dovrebbero avere tutte un'entropia quasi zero: C) D) E) …





2
Come può una rete neurale artificiale ANN essere utilizzata per il clustering senza supervisione?
Capisco come un artificial neural network (ANN), può essere addestrato in modo supervisionato usando backpropogation per migliorare l'adattamento diminuendo l'errore nelle previsioni. Ho sentito che un ANN può essere utilizzato per l'apprendimento senza supervisione, ma come può essere fatto senza una funzione di costo di qualche tipo per guidare le …



Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.