Ho due implementazioni di un algoritmo genetico che dovrebbero comportarsi in modo equivalente. Tuttavia, a causa di restrizioni tecniche che non possono essere risolte, il loro output non è esattamente lo stesso, dato lo stesso input.
Mi piacerebbe comunque dimostrare che non vi è alcuna differenza significativa nelle prestazioni.
Ho 20 corse con la stessa configurazione per ciascuno dei due algoritmi, usando semi di numeri casuali iniziali diversi. Per ogni corsa e generazione è stata registrata la minima idoneità all'errore della persona migliore nella popolazione . L'algoritmo impiega un meccanismo di conservazione dell'élite, quindi la forma fisica dell'individuo migliore sta diminuendo monotonicamente. Una corsa è composta da 1000 generazioni, quindi ho 1000 valori per corsa. Non riesco a ottenere più dati, poiché i calcoli sono molto costosi.
Quale test dovrei usare? Un modo semplice sarebbe probabilmente quello di confrontare l'errore solo nelle ultime generazioni (di nuovo, quale test dovrei usare qui)? Ma si potrebbe anche pensare di confrontare il comportamento di convergenza in generale.