Attualmente sto cercando di implementare alcuni algoritmi di Machine Learning da solo. Molti di loro hanno la cattiva proprietà di essere difficili da eseguire il debug, alcuni bug non causano l'arresto anomalo del programma, ma piuttosto funzionano non come previsto e sembrano che gli algoritmi danno solo risultati più deboli.
Vorrei avere un modo per aumentare la mia fiducia nell'implementazione, ad esempio se avessi alcuni piccoli set di dati, con informazioni aggiuntive "Algorithms X ha funzionato per iterazioni Y e ha avuto risultati Z su questo set di dati", sarebbe davvero utile. Qualcuno ha sentito parlare di tali set di dati?