Credevo che i diagrammi a riquadro qui sotto potessero essere interpretati come "la maggior parte degli uomini è più veloce della maggior parte delle donne" (in questo set di dati), principalmente perché il tempo degli uomini mediani era inferiore a quello delle donne mediane. Ma il corso EdX sul quiz su R e statistiche mi ha detto che non è corretto. Ti prego, aiutami a capire perché il mio intuito non è corretto.
Ecco la domanda:
Consideriamo un campione casuale di finalisti della Maratona di New York nel 2002. Questo set di dati può essere trovato nel pacchetto UsingR. Caricare la libreria e quindi caricare il set di dati nym.2002.
library(dplyr) data(nym.2002, package="UsingR")Usa grafici a scatole e istogrammi per confrontare i tempi di finitura di maschi e femmine. Quale delle seguenti definizioni descrive meglio la differenza?
- I maschi e le femmine hanno la stessa distribuzione.
- La maggior parte dei maschi è più veloce della maggior parte delle donne.
- Il maschio e la femmina hanno distribuzioni similari distorte a destra con il primo, spostato di 20 minuti a sinistra.
- Entrambe le distribuzioni sono normalmente distribuite con una differenza media di circa 30 minuti.
Ecco i tempi della maratona di New York per maschi e femmine, come quantili, istogrammi e grafici a scatole:
# Men's time quantile
0% 25% 50% 75% 100%
147.3333 226.1333 256.0167 290.6375 508.0833
# Women's time quantile
0% 25% 50% 75% 100%
175.5333 250.8208 277.7250 309.4625 566.7833







