Per parte di una domanda a casa, mi è stato chiesto di calcolare la media tagliata per un set di dati eliminando l'osservazione più piccola e più grande e di interpretare il risultato. La media tagliata era inferiore alla media non tagliata.
La mia interpretazione era che ciò era dovuto al fatto che la distribuzione sottostante era inclinata positivamente, quindi la coda sinistra è più densa della coda destra. Come risultato di questa asimmetria, la rimozione di un dato elevato trascina la media più in basso rispetto alla rimozione di un dato basso lo spinge verso l'alto, perché, informalmente parlando, ci sono più dati bassi "in attesa di prendere il suo posto". (È ragionevole?)
Quindi ho iniziato a chiedermi in che modo la percentuale di taglio influisce su questo, quindi ho calcolato la media tagliata per vari . Ho una forma parabolica interessante:
Non sono sicuro di come interpretarlo. Intuitivamente, sembra che la pendenza del grafico dovrebbe essere (proporzionale a) l'asimmetria negativa della porzione di distribuzione all'interno di punti di dati della mediana. (Questa ipotesi si verifica con i miei dati, ma ho solo , quindi non sono molto fiducioso.)
Questo tipo di grafico ha un nome o è comunemente usato? Quali informazioni possiamo ricavare da questo grafico? C'è un'interpretazione standard?
Per riferimento, i dati sono: 4, 5, 5, 6, 11, 17, 18, 23, 33, 35, 80.