Scienza dei dati

5

Come disegnare diagrammi di architettura di rete di apprendimento profondo?

Ho costruito il mio modello. Ora voglio disegnare il diagramma dell'architettura di rete per il mio documento di ricerca. L'esempio è mostrato di seguito:

78 machine-learning neural-network deep-learning svm software-recommendation

11

SVM con scikit learn funziona all'infinito e non completa mai l'esecuzione

Sto cercando di eseguire SVR usando scikit learn (python) su un set di dati di allenamento con 595605 righe e 5 colonne (caratteristiche) e test set di dati con 397070 righe. I dati sono stati pre-elaborati e regolarizzati. Sono in grado di eseguire correttamente gli esempi di test, ma eseguendo …

76 python svm scikit-learn

5

Perché le funzioni di costo utilizzano l'errore quadrato?

Sto appena iniziando con l'apprendimento automatico e fino ad ora ho avuto a che fare con una regressione lineare su una variabile. Ho imparato che esiste un'ipotesi, che è: hθ(x)=θ0+θ1xhθ(x)=θ0+θ1xh_\theta(x)=\theta_0+\theta_1x Per scoprire buoni valori per i parametri e vogliamo minimizzare la differenza tra il risultato calcolato e il risultato effettivo …

73 machine-learning linear-regression loss-function

1

Differenza tra isna () e isnull () nei panda

Uso i panda da un po 'di tempo. Ma non capisco qual è la differenza tra isna()e isnull()nei panda. E, soprattutto, quale utilizzare per identificare i valori mancanti nel frame di dati. Qual è la differenza di base alla base di come viene rilevato un valore come uno nao null?

73 python pandas dataframe

11

Perché le persone preferiscono i panda a SQL?

Uso SQL dal 1996, quindi potrei essere di parte. Ho usato ampiamente MySQL e SQLite 3, ma ho anche usato Microsoft SQL Server e Oracle. La stragrande maggioranza delle operazioni che ho visto fare con Panda può essere eseguita più facilmente con SQL. Ciò include il filtraggio di un set …

69 pandas sql

8

Quando dovrei usare Gini Impurity invece di Information Gain?

Qualcuno può praticamente spiegare la logica alla base dell'impurità di Gini rispetto al guadagno di informazioni (basato sull'entropia)? Quale metrica è meglio usare in diversi scenari mentre si usano gli alberi delle decisioni?

66 machine-learning decision-trees

8

Data scientist vs machine learning engineer

Quali sono le eventuali differenze tra un "data scientist" e un "machine learning engineer"? Nel corso dell'ultimo anno, "l'ingegnere dell'apprendimento automatico" ha iniziato a farsi notare nelle offerte di lavoro. Ciò è particolarmente evidente a San Francisco, che è probabilmente l'origine del termine "scienziato dei dati". A un certo punto …

66 machine-learning

5

Previsione di serie storiche usando ARIMA vs LSTM

Il problema con cui ho a che fare è prevedere i valori delle serie temporali. Sto guardando una serie temporale alla volta e, ad esempio, basandomi sul 15% dei dati di input, vorrei prevederne i valori futuri. Finora mi sono imbattuto in due modelli: LSTM (memoria a breve termine; una …

64 time-series deep-learning rnn prediction

3

Vantaggi dell'AUC rispetto alla precisione standard

Stavo iniziando a esaminare l'area sotto la curva (AUC) e sono un po 'confuso per la sua utilità. Quando mi è stato spiegato per la prima volta, l'AUC sembrava essere una grande misura delle prestazioni, ma nella mia ricerca ho scoperto che alcuni sostengono che il suo vantaggio è per …

64 machine-learning accuracy

6

stringhe come funzioni nell'albero decisionale / foresta casuale

Sto riscontrando alcuni problemi su un'applicazione dell'albero decisionale / foresta casuale. Sto cercando di adattare un problema che ha numeri e stringhe (come il nome del paese) come funzionalità. Ora la libreria, scikit-learn prende solo i numeri come parametri, ma voglio iniettare le stringhe oltre a portare una notevole quantità …

64 machine-learning python scikit-learn random-forest decision-trees

1

Come ottenere la correlazione tra due variabili categoriali e una variabile categoriale e una variabile continua?

Sto costruendo un modello di regressione e devo calcolare il seguito per verificare le correlazioni Correlazione tra 2 variabili categoriali multilivello Correlazione tra una variabile categoriale multilivello e una variabile continua VIF (fattore di inflazione di varianza) per variabili categoriali multilivello Credo che sia sbagliato usare il coefficiente di correlazione …

63 r statistics correlation

2

Addestramento di un RNN con esempi di diverse lunghezze in Keras

Sto cercando di iniziare a conoscere gli RNN e sto usando Keras. Comprendo le premesse di base dei livelli Vanilla RNN e LSTM, ma ho difficoltà a comprendere un certo punto tecnico per l'allenamento. Nella documentazione di keras , dice che l'input di un layer RNN deve avere forma (batch_size, …

63 python keras rnn training

3

Backprop attraverso i livelli di pooling massimo?

Questa è una piccola domanda concettuale che mi assilla da un po 'di tempo: come possiamo propagare indietro attraverso uno strato di max pooling in una rete neurale? Mi sono imbattuto nei livelli di max pooling durante questa esercitazione per la libreria nn di Torch 7. La libreria estrae il …

62 neural-network backpropagation

8

Rilevazione di anomalie open source in Python

Contesto del problema: sto lavorando a un progetto che prevede file di registro simili a quelli presenti nello spazio di monitoraggio IT (per la mia migliore comprensione dello spazio IT). Questi file di registro sono dati di serie temporali, organizzati in centinaia / migliaia di righe di vari parametri. Ogni …

61 machine-learning python data-mining anomaly-detection library

11

Che cos'è la riduzione della dimensionalità? Qual è la differenza tra la selezione delle funzioni e l'estrazione?

Da Wikipedia, la riduzione della dimensionalità o la riduzione della dimensione è il processo di riduzione del numero di variabili casuali in esame e può essere suddiviso in selezione e estrazione delle caratteristiche. Qual è la differenza tra la selezione e l'estrazione della funzione? Qual è un esempio di riduzione …

59 feature-selection feature-extraction dimensionality-reduction