Diciamo che abbiamo il seguente frame di dati:
TY_MAX
141 1.004622
142 1.004645
143 1.004660
144 1.004672
145 1.004773
146 1.004820
147 1.004814
148 1.004807
149 1.004773
150 1.004820
151 1.004814
152 1.004834
153 1.005117
154 1.005023
155 1.004928
156 1.004834
157 1.004827
158 1.005023
159 1.005248
160 1.005355
25th: 1.0031185409705132
50th: 1.004634349800723
75th: 1.0046683578907745
Calculated 50th: 1.003893449430644
Sono un po 'confuso qui. Se otteniamo il 75 ° centesimo, il 75% dei dati dovrebbe essere inferiore a quel percentile. E se riusciamo al 25 ° percentile, il 25% dei dati dovrebbe essere inferiore a quel 25 °. Ora sto pensando che il 50% dei dati dovrebbe essere compreso tra il 25 e il 50. E anche il 50 ° percentile mi dà un valore diverso. Abbastanza giusto, il che significa che il 50% dei dati dovrebbe essere inferiore a questo valore. Ma la mia domanda è se il mio approccio è corretto?
EDIT: E possiamo anche dire che il 98% dei dati sarà compreso tra il 1 ° e il 99 ° percentile?