Domande taggate «dataset»

Le richieste di set di dati sono fuori tema su questo sito. Utilizzare questo tag per domande relative alla creazione, all'elaborazione o alla manutenzione di set di dati.


2
Classificazione dei test sui dati di squilibrio sovracampionato
Sto lavorando a dati gravemente squilibrati. In letteratura, vengono utilizzati diversi metodi per riequilibrare i dati utilizzando il ricampionamento (sovra o sottocampionamento). Due buoni approcci sono: SMOTE: Tecnica di sovracampionamento di minoranza sintetica ( SMOTE ) ADASYN: Approccio di campionamento sintetico adattivo per l'apprendimento sbilanciato ( ADASYN ) Ho implementato …


6
Dove trovare un corpus di testo di grandi dimensioni? [chiuso]
Chiuso. Questa domanda è fuori tema . Al momento non accetta risposte. Vuoi migliorare questa domanda? Aggiorna la domanda in modo che sia in argomento per Cross Validated. Chiuso 6 anni fa . Sto cercando corpus di testo di grandi dimensioni (> 1000) da scaricare. Preferibilmente con notizie dal mondo …
16 dataset 




4
Hosting gratuito di dati di interesse pubblico? [chiuso]
Chiuso. Questa domanda è fuori tema . Al momento non accetta risposte. Vuoi migliorare questa domanda? Aggiorna la domanda in modo che sia in argomento per Cross Validated. Chiuso 4 anni fa . Ho rapporti di temperatura oraria e giornaliera per molte stazioni su http://data.barrycarter.info/ Incoraggio le persone a scaricarlo, …
14 dataset 

3
Come eseguire la suddivisione dei dati e convalidare il treno?
Sto facendo la classificazione delle immagini usando l'apprendimento automatico. Supponiamo che io abbia alcuni dati di allenamento (immagini) e li dividerò in set di addestramento e validazione. E voglio anche aumentare i dati (produrre nuove immagini da quelle originali) con rotazioni casuali e iniezione di rumore. Augmentaion viene eseguito offline. …





4
Separare due popolazioni dal campione
Sto cercando di separare due gruppi di valori da un singolo set di dati. Posso presumere che una delle popolazioni sia normalmente distribuita e abbia almeno la metà della dimensione del campione. I valori del secondo sono entrambi inferiori o superiori ai valori del primo (la distribuzione è sconosciuta). Quello …

4
Modi migliori per aggregare e analizzare i dati
Avendo appena iniziato a insegnare a me stesso l'apprendimento automatico e l'analisi dei dati, mi ritrovo a colpire un muro di mattoni sulla necessità di creare e interrogare grandi serie di dati. Vorrei prendere i dati che ho aggregato nella mia vita professionale e personale e analizzarli, ma non sono …

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.