Un set di dati è una raccolta di dati, spesso in forma tabellare o matrice. Questo tag NON è destinato alle richieste di dati ("dove posso trovare un set di dati su ...") -> vedi OpenData
Sono uno studente master CS nel data mining. Il mio supervisore una volta mi disse che prima di eseguire qualsiasi classificatore o fare qualsiasi cosa con un set di dati, devo comprendere appieno i dati e assicurarmi che siano puliti e corretti. Le mie domande: Quali sono le migliori pratiche …
Salve, ho un frame di dati con valori categorici elevati su oltre 1600 categorie, esiste un modo per trovare alternative in modo da non avere più di 1600 colonne. Ho trovato questo link interessante sotto http://amunategui.github.io/feature-hashing/#sourcecode Ma si stanno convertendo in classe / oggetto che non voglio. Voglio il mio …
Devo sapere perché dobbiamo affrontare lo squilibrio dei dati. So come affrontarlo e diversi metodi per risolvere il problema che consiste nel campionare in alto o in basso o usando Smote. Ad esempio, se ho una malattia rara dell'1 percento su 100, e diciamo che ho deciso di avere un …
Voglio indagare sul comportamento di determinazione dei prezzi delle compagnie aeree, in particolare su come le compagnie aeree reagiscono ai prezzi dei concorrenti. Come direi che la mia conoscenza di analisi più complesse è piuttosto limitata, ho fatto principalmente tutti i metodi di base per raccogliere una visione generale dei …
Qualcuno sa se è possibile importare un set di dati di grandi dimensioni in Amazon S3 da un URL? Fondamentalmente, voglio evitare di scaricare un file enorme e quindi ricaricarlo su S3 attraverso il portale web. Voglio solo fornire l'URL di download a S3 e aspettare che lo scarichino nel …
Esistono delle regole empiriche (o regole effettive) relative alla quantità minima, massima e "ragionevole" di celle LSTM che dovrei usare? In particolare mi riferisco a BasicLSTMCell di TensorFlow e num_unitsproprietà. Si prega di supporre che ho un problema di classificazione definito da: t - number of time steps n - …
Sto prototipando un'applicazione e ho bisogno di un modello linguistico per calcolare la perplessità su alcune frasi generate. Esiste un modello di linguaggio addestrato in Python che posso usare facilmente? Qualcosa di semplice come model = LanguageModel('en') p1 = model.perplexity('This is a well constructed sentence') p2 = model.perplexity('Bunny lamp robert …
Ho lavorato sull'apprendimento automatico e la bioinformatica per un po ', e oggi ho avuto una conversazione con un collega sui principali problemi generali del data mining. Il mio collega (che è un esperto di apprendimento automatico) ha affermato che, a suo avviso, l'aspetto pratico probabilmente più importante dell'apprendimento automatico …
Esistono molte fonti che forniscono i dati storici sullo stock ma forniscono solo i campi OHLC insieme al volume e alla chiusura corretta. Anche un paio di fonti che ho trovato forniscono set di dati sulla capitalizzazione di mercato, ma sono limitati ai titoli statunitensi. Yahoo Finance fornisce questi dati …
Sto affrontando una situazione in cui il numero di esempi positivi e negativi in un set di dati è squilibrato. La mia domanda è: ci sono delle regole empiriche che ci dicono quando dovremmo sottocampionare la grande categoria per forzare un qualche tipo di bilanciamento nel set di dati. Esempi: …
Esistono diversi set di dati classici per le attività di classificazione / regressione di apprendimento automatico. I più popolari sono: Set di dati di fiori di iris ; Set di dati Titanic ; Automobili di tendenza del motore ; eccetera. Ma qualcuno conosce set di dati simili per l'analisi di …
Ho letto la spiegazione della convoluzione e la capisco fino a un certo punto. Qualcuno può aiutarmi a capire come questa operazione si collega alla convoluzione nelle reti neurali convoluzionali? È una funzione simile a un filtro gche applica peso?
Ho due tensori a:[batch_size, dim] b:[batch_size, dim]. Voglio fare un prodotto interno per ogni coppia nel lotto, generando c:[batch_size, 1], dove c[i,0]=a[i,:].T*b[i,:]. Come?
Chiuso . Questa domanda deve essere più focalizzata . Al momento non accetta risposte. Vuoi migliorare questa domanda? Aggiorna la domanda in modo che si concentri su un problema solo modificando questo post . Chiuso 4 anni fa . Sto lavorando a un progetto e ho difficoltà a decidere quale …
Sto cercando di trovare dati di borsa con cui esercitarmi, c'è una buona risorsa per questo? Ho trovato questo: ftp://emi.nasdaq.com/ITCH/ ma ha solo l'anno in corso. Ho già un modo per analizzare il protocollo, ma vorrei avere altri dati con cui confrontarli. Non deve essere nello stesso formato, purché abbia …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.