Qual è la differenza tra la discesa del gradiente e la discesa del gradiente stocastico? Non ho molta familiarità con questi, puoi descriverne la differenza con un breve esempio?
Chiuso . Questa domanda è basata sull'opinione . Al momento non accetta risposte. Vuoi migliorare questa domanda? Aggiorna la domanda in modo che possa essere risolta con fatti e citazioni modificando questo post . Chiuso 5 anni fa . Non so se questo sia il posto giusto per porre questa …
Esistono molte tecniche per visualizzare set di dati ad alta dimensione, come T-SNE, isomap, PCA, PCA supervisionato, ecc. E seguiamo i movimenti della proiezione dei dati in uno spazio 2D o 3D, quindi abbiamo una "bella immagine ". Alcuni di questi metodi di incorporamento (apprendimento multiplo) sono descritti qui . …
È meglio codificare funzioni come il mese e l'ora come fattore o numerico in un modello di apprendimento automatico? Da un lato, ritengo che la codifica numerica potrebbe essere ragionevole, perché il tempo è un processo che avanza in avanti (il quinto mese è seguito dal sesto mese), ma dall'altro …
Attualmente sto lavorando con Python e Scikit per imparare a fini di classificazione, e facendo alcune letture su GridSearch ho pensato che questo fosse un ottimo modo per ottimizzare i miei parametri di stima per ottenere i migliori risultati. La mia metodologia è questa: Dividi i miei dati in allenamento …
Stavo leggendo la soluzione a questa sfida OTTO Kaggle e la soluzione al primo posto sembra utilizzare diverse trasformazioni per i dati di input X, ad esempio Log (X + 1), sqrt (X + 3/8), ecc. C'è un linea guida generale su quando applicare quali trasformazioni di tipo a vari …
Ho sentito spesso persone dire che il motivo per cui le reti neurali convoluzionali sono ancora poco comprese. È noto perché le reti neurali convoluzionali finiscono sempre per apprendere caratteristiche sempre più sofisticate mentre saliamo di livello? Cosa li ha spinti a creare una tale serie di funzionalità e questo …
Sto cercando un documento che descriva in dettaglio le basi del deep learning. Idealmente come il corso Andrew Ng per l'apprendimento profondo. Sai dove posso trovarlo?
Come calcolare il mAP (media precisione media) per l'attività di rilevamento per le classifiche Pascal VOC? http://host.robots.ox.ac.uk:8080/leaderboard/displaylb.php?challengeid=11&compid=4 Ci ha detto - a pagina 11 : http://homepages.inf.ed.ac.uk/ckiw/postscript/ijcv_voc09.pdf Precisione media (AP). Per la sfida VOC2007, la precisione media interpolata (Salton e Mcgill 1986) è stata utilizzata per valutare sia la classificazione che …
Recentemente a un mio amico è stato chiesto se gli algoritmi dell'albero decisionale fossero algoritmi lineari o non lineari in un'intervista. Ho cercato di cercare risposte a questa domanda ma non sono riuscito a trovare spiegazioni soddisfacenti. Qualcuno può rispondere e spiegare la soluzione a questa domanda? Inoltre, quali sono …
Mi chiedo se esiste uno scenario in cui la discesa del gradiente non converge al minimo. Sono consapevole che la discesa gradiente non è sempre garantita per convergere in un ottimale globale. Sono anche consapevole che potrebbe divergere da un ottimale se, diciamo, la dimensione del passo è troppo grande. …
Voglio calcolare la precisione, il richiamo e il punteggio F1 per il mio modello binario KerasClassifier, ma non trovo alcuna soluzione. Ecco il mio codice attuale: # Split dataset in train and test data X_train, X_test, Y_train, Y_test = train_test_split(normalized_X, Y, test_size=0.3, random_state=seed) # Build the model model = Sequential() …
Stavo esaminando la documentazione ufficiale di scikit-learn learn dopo aver letto un libro su ML e mi sono imbattuto nella seguente cosa: Nella Documentazione è data sklearn.preprocessing.OrdinalEncoder()mentre mentre nel libro è stata data sklearn.preprocessing.LabelEncoder(), quando ho verificato la loro funzionalità mi è sembrato lo stesso. Qualcuno può dirmi la differenza …
Durante la lettura di questo documento c'è una riga che dice "i classificatori lineari non condividono i parametri tra caratteristiche e classi". Qual è il significato di questa affermazione? Significa che i classificatori lineari come la regressione logistica necessitano di funzioni reciprocamente indipendenti?
Quando stavo leggendo sull'uso StandardScaler, la maggior parte dei consigli dicevano che dovresti usare StandardScaler prima di suddividere i dati in treno / test, ma quando stavo controllando alcuni dei codici pubblicati online (usando sklearn) c'erano due usi principali. 1- Utilizzo StandardScalersu tutti i dati. Per esempio from sklearn.preprocessing import …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.