Il set di dati "Iris" è probabilmente familiare alla maggior parte delle persone qui: è uno dei set di dati di test canonici e un set di dati di esempio per tutto, dalla visualizzazione dei dati all'apprendimento automatico. Ad esempio, tutti in questa domanda hanno finito per usarlo per una discussione su grafici a dispersione separati dal trattamento.
Cosa rende il set di dati Iris così utile? Solo che era lì prima? Se qualcuno stesse cercando di creare un utile esempio / set di dati di test, quali lezioni potrebbero trarne?