Le richieste di set di dati sono fuori tema su questo sito. Utilizzare questo tag per domande relative alla creazione, all'elaborazione o alla manutenzione di set di dati.
Sto lavorando a dati gravemente squilibrati. In letteratura, vengono utilizzati diversi metodi per riequilibrare i dati utilizzando il ricampionamento (sovra o sottocampionamento). Due buoni approcci sono: SMOTE: Tecnica di sovracampionamento di minoranza sintetica ( SMOTE ) ADASYN: Approccio di campionamento sintetico adattivo per l'apprendimento sbilanciato ( ADASYN ) Ho implementato …
Stavo cercando di calcolare il 95o percentile sul seguente set di dati. Mi sono imbattuto in alcuni riferimenti online di farlo. Approccio 1: basato su dati di esempio Il primo mi dice di ottenere il TOP 95 Percentset di dati e quindi scegliere il MINo AVGdel set risultante. Farlo per …
Chiuso. Questa domanda è fuori tema . Al momento non accetta risposte. Vuoi migliorare questa domanda? Aggiorna la domanda in modo che sia in argomento per Cross Validated. Chiuso 6 anni fa . Sto cercando corpus di testo di grandi dimensioni (> 1000) da scaricare. Preferibilmente con notizie dal mondo …
Qualcuno può riassumere per me con possibili esempi, in quali situazioni aumentando i dati di allenamento migliora il sistema complessivo? Quando rileviamo che l'aggiunta di più dati di allenamento potrebbe eventualmente contenere dati eccessivi e non fornire una buona precisione sui dati del test? Questa è una domanda molto non …
Mi rendo conto che questo è soggettivo, ma ho pensato che sarebbe bello parlare dei nostri set di dati preferiti e di ciò che pensiamo li renda interessanti. Ci sono molti dati là fuori, e con tutte le API (ad es. Datamob ) insieme ai set di dati classici (ad …
Sto eseguendo l'analisi dei dati esplorativi (EDA) su un set di dati. Quindi selezionerò alcune funzionalità per prevedere una variabile dipendente. La domanda è: devo fare l'EDA solo sul mio set di dati di addestramento? O dovrei unirmi ai set di dati di training e test insieme, quindi fare l'EDA …
Chiuso. Questa domanda è fuori tema . Al momento non accetta risposte. Vuoi migliorare questa domanda? Aggiorna la domanda in modo che sia in argomento per Cross Validated. Chiuso 4 anni fa . Ho rapporti di temperatura oraria e giornaliera per molte stazioni su http://data.barrycarter.info/ Incoraggio le persone a scaricarlo, …
Sto facendo la classificazione delle immagini usando l'apprendimento automatico. Supponiamo che io abbia alcuni dati di allenamento (immagini) e li dividerò in set di addestramento e validazione. E voglio anche aumentare i dati (produrre nuove immagini da quelle originali) con rotazioni casuali e iniezione di rumore. Augmentaion viene eseguito offline. …
Chiuso. Questa domanda è fuori tema . Al momento non accetta risposte. Vuoi migliorare questa domanda? Aggiorna la domanda in modo che sia in argomento per Cross Validated. Chiuso 2 anni fa . A volte ho bisogno di ottenere solo la prima riga di un set di dati raggruppati per …
La mia domanda principale riguarda il tentativo di capire come k-fold cross-validation si adatta al contesto di avere set di training / validation / testing (se si adatta a tutti in tale contesto). Di solito, le persone parlano di dividere i dati in un set di addestramento, validazione e test …
Chiuso. Questa domanda è fuori tema . Al momento non accetta risposte. Vuoi migliorare questa domanda? Aggiorna la domanda in modo che sia in argomento per Cross Validated. Chiuso 2 anni fa . Vorrei utilizzare dati grezzi sugli studi clinici per l'esame di fine anno dei miei studenti di master. …
Utilizzando R o Excel, qual è il modo più semplice per convertire una tabella di frequenza in un vettore di valori? Ad esempio, come convertiresti la seguente tabella di frequenza Value Frequency 1. 2 2. 1 3. 4 4. 2 5. 1 nel seguente vettore? 1, 1, 2, 3, 3, …
Sto cercando di separare due gruppi di valori da un singolo set di dati. Posso presumere che una delle popolazioni sia normalmente distribuita e abbia almeno la metà della dimensione del campione. I valori del secondo sono entrambi inferiori o superiori ai valori del primo (la distribuzione è sconosciuta). Quello …
Avendo appena iniziato a insegnare a me stesso l'apprendimento automatico e l'analisi dei dati, mi ritrovo a colpire un muro di mattoni sulla necessità di creare e interrogare grandi serie di dati. Vorrei prendere i dati che ho aggregato nella mia vita professionale e personale e analizzarli, ma non sono …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.