Domande taggate «bigdata»

Big data è il termine per una raccolta di set di dati così grandi e complessi che diventa difficile elaborarli utilizzando strumenti di gestione di database disponibili o applicazioni di elaborazione dati tradizionali. Le sfide includono acquisizione, cura, archiviazione, ricerca, condivisione, trasferimento, analisi e visualizzazione.

3
Gestire un set di funzionalità in costante aumento
Sto lavorando a un sistema di rilevamento delle frodi. In questo campo, nuove frodi appaiono regolarmente, quindi è necessario aggiungere nuove funzionalità al modello su base continuativa. Mi chiedo quale sia il modo migliore per gestirlo (dal punto di vista del processo di sviluppo)? L'aggiunta di una nuova funzionalità nel …


1
Evita di ricaricare DataFrame tra diversi kernel Python
Esiste un modo per mantenere una variabile (tabella di grandi dimensioni / frame di dati) in memoria e condividerla su più notebook ipython? Cercherei qualcosa, concettualmente simile alle variabili persistenti di MATLAB. Lì è possibile chiamare una funzione / libreria personalizzata da più singoli editor (notebook), e avere quella funzione …

3

2
Quando scegliere la regressione lineare o la regressione dell'albero decisionale o della foresta casuale? [chiuso]
Chiuso . Questa domanda deve essere più focalizzata . Al momento non accetta risposte. Vuoi migliorare questa domanda? Aggiorna la domanda in modo che si concentri su un problema solo modificando questo post . Chiuso 4 anni fa . Sto lavorando a un progetto e ho difficoltà a decidere quale …
10 machine-learning  algorithms  random-forest  linear-regression  decision-trees  machine-learning  predictive-modeling  forecast  r  clustering  similarity  data-mining  dataset  statistics  text-mining  text-mining  data-cleaning  data-wrangling  machine-learning  classification  algorithms  xgboost  data-mining  dataset  dataset  regression  graphs  svm  unbalanced-classes  cross-validation  optimization  hyperparameter  genetic-algorithms  visualization  predictive-modeling  correlation  machine-learning  predictive-modeling  apache-spark  statistics  normalization  apache-spark  map-reduce  r  correlation  confusion-matrix  r  data-cleaning  classification  terminology  dataset  image-classification  machine-learning  regression  apache-spark  machine-learning  data-mining  nlp  parsing  machine-learning  dimensionality-reduction  visualization  clustering  multiclass-classification  evaluation  unsupervised-learning  machine-learning  machine-learning  data-mining  supervised-learning  unsupervised-learning  machine-learning  data-mining  classification  statistics  predictive-modeling  data-mining  clustering  python  pandas  machine-learning  dataset  data-cleaning  data  bigdata  software-recommendation 


1
Differenza tra interpolate () e fillna () nei panda
Poiché il metodo interpolare e fillna fa lo stesso lavoro di riempimento di valori na. Qual è la differenza di base tra i due. Qual è il significato di avere questi due diversi metodi ?? Qualcuno può spiegarmi in termini laici. Ho già visitato la documentazione ufficiale e volevo sapere …



1
Errore in cascata in Apache Storm
Durante la presentazione e il materiale di Summingbird da parte di Twitter, uno dei motivi menzionati per l'utilizzo dei cluster Storm e Hadoop insieme in Summingbird è che l'elaborazione attraverso Storm si traduce in una cascata di errori. Al fine di evitare questa cascata di errori e accumulo, il cluster …
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.