Qual è il giusto approccio e algoritmo di clustering per il clustering di geolocalizzazione? Sto usando il seguente codice per raggruppare le coordinate di geolocalizzazione: import numpy as np import matplotlib.pyplot as plt from scipy.cluster.vq import kmeans2, whiten coordinates= np.array([ [lat, long], [lat, long], ... [lat, long] ]) x, y …
La logica spesso afferma che, sovradimensionando un modello, la sua capacità di generalizzazione è limitata, sebbene ciò possa significare solo che il sovradimensionamento impedisce a un modello di migliorare dopo una certa complessità. Il sovradimensionamento fa sì che i modelli peggiorino indipendentemente dalla complessità dei dati e, in tal caso, …
Sto usando TensorFlow per esperimenti principalmente con reti neurali. Anche se ho fatto alcuni esperimenti (XOR-Problem, MNIST, alcune cose di regressione, ...) ora, faccio fatica a scegliere la funzione di costo "corretta" per problemi specifici perché nel complesso potrei essere considerato un principiante. Prima di arrivare a TensorFlow ho codificato …
Le reti neurali ottengono migliori risultati in compiti di visione artificiale (vedi MNIST , ILSVRC , Kaggle Galaxy Sfida ). Sembrano sovraperformare ogni altro approccio in Computer Vision. Ma ci sono anche altri compiti: Sfida di attività molecolare di Kaggle Regressione: previsione Kaggle Rain , anche il 2 ° posto …
Il mio compito di "machine learning" è quello di separare il traffico Internet benigno dal traffico malevolo. Nello scenario del mondo reale, la maggior parte (diciamo del 90% o più) del traffico Internet è benigna. Quindi ho sentito che avrei dovuto scegliere una configurazione di dati simile per addestrare anche …
Quali sono le pratiche migliori / comuni per gestire i dati temporali per l'applicazione di apprendimento automatico? Ad esempio, se nel set di dati è presente una colonna con data / ora dell'evento, ad esempio "05-05-2014", come è possibile estrarre funzioni utili da questa colonna? Grazie in anticipo!
ho letto un po 'su LSTM e il loro uso per le serie storiche ed è stato interessante ma allo stesso tempo difficile. Una cosa che ho avuto difficoltà a comprendere è l'approccio all'aggiunta di funzionalità aggiuntive a quello che è già un elenco di funzionalità di serie storiche. Supponendo …
Sto cercando di capire le differenze chiave tra GBM e XGBOOST. Ho provato a cercarlo su Google, ma non sono riuscito a trovare buone risposte che spiegassero le differenze tra i due algoritmi e perché xgboost abbia quasi sempre prestazioni migliori di GBM. Cosa rende XGBOOST così veloce?
Ho letto spesso che, nel caso dei modelli di Deep Learning, la pratica abituale è quella di applicare mini lotti (generalmente uno piccolo, 32/64) in diverse epoche di allenamento. Non riesco davvero a capire il motivo dietro questo. A meno che non mi sbagli, la dimensione del batch è il …
Stavo leggendo questo post del blog dal titolo: Il mondo finanziario vuole aprire le scatole nere di AI , in cui l'autore fa ripetutamente riferimento ai modelli ML come "scatole nere". Una terminologia simile è stata utilizzata in diversi punti quando si fa riferimento ai modelli ML. Perché è così? …
Sono un Rprogrammatore di lingue. Sono anche nel gruppo di persone che sono considerate Data Scientist ma che provengono da discipline accademiche diverse dalla CS. Questo funziona bene nel mio ruolo di Data Scientist, tuttavia, iniziando la mia carriera Re avendo solo una conoscenza di base di altri linguaggi di …
Ho una serie di set di dati NFL che penso possano costituire un buon progetto collaterale, ma non ho ancora fatto nulla con loro. Venire su questo sito mi ha fatto pensare agli algoritmi di machine learning e mi chiedevo quanto potessero essere bravi a predire il risultato dei giochi …
Recentemente in una lezione di Machine Learning del professor Oriol Pujol presso UPC / Barcellona ha descritto gli algoritmi, i principi e i concetti più comuni da utilizzare per una vasta gamma di attività correlate all'apprendimento automatico. Qui li condivido con te e ti chiedo: Esistono attività di abbinamento del …
Ho eseguito un modello xgboost. Non so esattamente come interpretare l'output di xgb.importance. Qual è il significato di guadagno, copertura e frequenza e come li interpretiamo? Inoltre, cosa significano Split, RealCover e RealCover%? Ho alcuni parametri extra qui Ci sono altri parametri che possono dirmi di più sull'importanza delle funzionalità? …
È stato consuetudine per gli utenti di comunità diverse citare cose divertenti sui loro campi. Potrebbe essere divertente condividere le tue cose divertenti su Machine Learning, Deep Learning, Data Science e le cose che affronti ogni giorno!
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.