Quali sono i set di dati disponibili gratuitamente per la classificazione con più di 1000 funzioni (o punti campione se contiene curve)?
Esiste già una wiki della comunità sui set di dati gratuiti: individuazione di campioni di dati disponibili gratuitamente
Ma qui, sarebbe bello avere un elenco più mirato che può essere utilizzato in modo più conveniente , inoltre propongo le seguenti regole:
- Un post per set di dati
- Nessun collegamento al set di set di dati
ogni set di dati deve essere associato
un nome (per capire di cosa si tratta) e un collegamento al set di dati (i set di dati R possono essere nominati con il nome del pacchetto)
il numero di funzionalità (supponiamo che sia p ) la dimensione del set di dati (supponiamo che sia n ) e il numero di etichette / classe (supponiamo che sia k )
un tipico tasso di errore derivante dalla tua esperienza (indica l'algoritmo usato in parole) o dalla letteratura (in quest'ultimo caso collega il documento)