Domande taggate «pyspark»


1
Quante celle LSTM dovrei usare?
Esistono delle regole empiriche (o regole effettive) relative alla quantità minima, massima e "ragionevole" di celle LSTM che dovrei usare? In particolare mi riferisco a BasicLSTMCell di TensorFlow e num_unitsproprietà. Si prega di supporre che ho un problema di classificazione definito da: t - number of time steps n - …
12 rnn  machine-learning  r  predictive-modeling  random-forest  python  language-model  sentiment-analysis  encoding  machine-learning  deep-learning  neural-network  dataset  caffe  classification  xgboost  multiclass-classification  unbalanced-classes  time-series  descriptive-statistics  python  r  clustering  machine-learning  python  deep-learning  tensorflow  machine-learning  python  predictive-modeling  probability  scikit-learn  svm  machine-learning  python  classification  gradient-descent  regression  research  python  neural-network  deep-learning  convnet  keras  python  tensorflow  machine-learning  deep-learning  tensorflow  python  r  bigdata  visualization  rstudio  pandas  pyspark  dataset  time-series  multilabel-classification  machine-learning  neural-network  ensemble-modeling  kaggle  machine-learning  linear-regression  cnn  convnet  machine-learning  tensorflow  association-rules  machine-learning  predictive-modeling  training  model-selection  neural-network  keras  deep-learning  deep-learning  convnet  image-classification  predictive-modeling  prediction  machine-learning  python  classification  predictive-modeling  scikit-learn  machine-learning  python  random-forest  sampling  training  recommender-system  books  python  neural-network  nlp  deep-learning  tensorflow  python  matlab  information-retrieval  search  search-engine  deep-learning  convnet  keras  machine-learning  python  cross-validation  sampling  machine-learning 

4
Importa il contenuto del file CSV in frame di dati pyspark
Come posso importare un file .csv in frame di dati pyspark? Ho anche provato a leggere il file CSV in Pandas e poi a convertirlo in un scintilla dataframe usando createDataFrame, ma mostra ancora qualche errore. Qualcuno può guidarmi attraverso questo? Inoltre, per favore dimmi come posso importare un file …
12 pyspark 



1
Spark ALS: raccomandare per i nuovi utenti
La domanda Come posso prevedere la valutazione per un nuovo utente in un modello ALS addestrato in Spark? (Nuovo = non visto durante il tempo di allenamento) Il problema Sto seguendo il tutorial ufficiale di Spark ALS qui: http://ampcamp.berkeley.edu/big-data-mini-course/movie-recommendation-with-mllib.html Sono in grado di creare un buon consulente con un MSE …

1
Spark, suddividendo in modo ottimale un singolo RDD in due
Ho un set di dati di grandi dimensioni che devo dividere in gruppi in base a parametri specifici. Voglio che il lavoro venga elaborato nel modo più efficiente possibile. Posso immaginare due modi per farlo Opzione 1 : creare una mappa dall'RDD originale e filtrare def customMapper(record): if passesSomeTest(record): return …


Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.