Domande e risposte per i professionisti della scienza dei dati, gli specialisti di Machine Learning e coloro che sono interessati a saperne di più sul campo
Ho costruito il mio modello. Ora voglio disegnare il diagramma dell'architettura di rete per il mio documento di ricerca. L'esempio è mostrato di seguito:
Sto cercando di eseguire SVR usando scikit learn (python) su un set di dati di allenamento con 595605 righe e 5 colonne (caratteristiche) e test set di dati con 397070 righe. I dati sono stati pre-elaborati e regolarizzati. Sono in grado di eseguire correttamente gli esempi di test, ma eseguendo …
Sto appena iniziando con l'apprendimento automatico e fino ad ora ho avuto a che fare con una regressione lineare su una variabile. Ho imparato che esiste un'ipotesi, che è: hθ(x)=θ0+θ1xhθ(x)=θ0+θ1xh_\theta(x)=\theta_0+\theta_1x Per scoprire buoni valori per i parametri e vogliamo minimizzare la differenza tra il risultato calcolato e il risultato effettivo …
Uso i panda da un po 'di tempo. Ma non capisco qual è la differenza tra isna()e isnull()nei panda. E, soprattutto, quale utilizzare per identificare i valori mancanti nel frame di dati. Qual è la differenza di base alla base di come viene rilevato un valore come uno nao null?
Uso SQL dal 1996, quindi potrei essere di parte. Ho usato ampiamente MySQL e SQLite 3, ma ho anche usato Microsoft SQL Server e Oracle. La stragrande maggioranza delle operazioni che ho visto fare con Panda può essere eseguita più facilmente con SQL. Ciò include il filtraggio di un set …
Qualcuno può praticamente spiegare la logica alla base dell'impurità di Gini rispetto al guadagno di informazioni (basato sull'entropia)? Quale metrica è meglio usare in diversi scenari mentre si usano gli alberi delle decisioni?
Quali sono le eventuali differenze tra un "data scientist" e un "machine learning engineer"? Nel corso dell'ultimo anno, "l'ingegnere dell'apprendimento automatico" ha iniziato a farsi notare nelle offerte di lavoro. Ciò è particolarmente evidente a San Francisco, che è probabilmente l'origine del termine "scienziato dei dati". A un certo punto …
Il problema con cui ho a che fare è prevedere i valori delle serie temporali. Sto guardando una serie temporale alla volta e, ad esempio, basandomi sul 15% dei dati di input, vorrei prevederne i valori futuri. Finora mi sono imbattuto in due modelli: LSTM (memoria a breve termine; una …
Stavo iniziando a esaminare l'area sotto la curva (AUC) e sono un po 'confuso per la sua utilità. Quando mi è stato spiegato per la prima volta, l'AUC sembrava essere una grande misura delle prestazioni, ma nella mia ricerca ho scoperto che alcuni sostengono che il suo vantaggio è per …
Sto riscontrando alcuni problemi su un'applicazione dell'albero decisionale / foresta casuale. Sto cercando di adattare un problema che ha numeri e stringhe (come il nome del paese) come funzionalità. Ora la libreria, scikit-learn prende solo i numeri come parametri, ma voglio iniettare le stringhe oltre a portare una notevole quantità …
Sto costruendo un modello di regressione e devo calcolare il seguito per verificare le correlazioni Correlazione tra 2 variabili categoriali multilivello Correlazione tra una variabile categoriale multilivello e una variabile continua VIF (fattore di inflazione di varianza) per variabili categoriali multilivello Credo che sia sbagliato usare il coefficiente di correlazione …
Sto cercando di iniziare a conoscere gli RNN e sto usando Keras. Comprendo le premesse di base dei livelli Vanilla RNN e LSTM, ma ho difficoltà a comprendere un certo punto tecnico per l'allenamento. Nella documentazione di keras , dice che l'input di un layer RNN deve avere forma (batch_size, …
Questa è una piccola domanda concettuale che mi assilla da un po 'di tempo: come possiamo propagare indietro attraverso uno strato di max pooling in una rete neurale? Mi sono imbattuto nei livelli di max pooling durante questa esercitazione per la libreria nn di Torch 7. La libreria estrae il …
Contesto del problema: sto lavorando a un progetto che prevede file di registro simili a quelli presenti nello spazio di monitoraggio IT (per la mia migliore comprensione dello spazio IT). Questi file di registro sono dati di serie temporali, organizzati in centinaia / migliaia di righe di vari parametri. Ogni …
Da Wikipedia, la riduzione della dimensionalità o la riduzione della dimensione è il processo di riduzione del numero di variabili casuali in esame e può essere suddiviso in selezione e estrazione delle caratteristiche. Qual è la differenza tra la selezione e l'estrazione della funzione? Qual è un esempio di riduzione …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.