Risposte:
Sulla base di alcuni dei commenti di @mary penso che quanto segue sia appropriato. Sembra che stia selezionando la mediana perché il campione è piccolo.
Se stavi selezionando la mediana perché è un piccolo campione che non è una buona giustificazione. Si seleziona la mediana perché la mediana è un valore importante. Dice qualcosa di diverso dalla media. Potresti anche selezionarlo per alcuni calcoli statistici perché è robusto contro alcuni problemi come valori anomali o inclinati. Tuttavia, la piccola dimensione del campione non è uno di quei problemi contro i quali è affidabile. Ad esempio, quando la dimensione del campione si riduce, in realtà è molto più sensibile all'inclinazione rispetto alla media.
Sokal e Rohlf danno questa formula nel loro libro Biometry (pagina 139). Sotto "Commenti sull'applicabilità" scrivono: Grandi campioni da popolazioni normali. Pertanto, temo che la risposta alla tua domanda sia no. Vedi anche qui .
Un modo per ottenere gli errori standard e gli intervalli di confidenza per la mediana in piccoli campioni con distribuzioni non normali sarebbe il bootstrap. Questo post fornisce collegamenti a pacchetti Python per il bootstrap.
avvertimento
@whuber ha sottolineato che il bootstrap della mediana in piccoli campioni non è molto informativo in quanto le giustificazioni del bootstrap sono asintotiche (vedere i commenti di seguito).
Il numero magico 1.253 deriva dalla formula della varianza asintotica :
Per qualsiasi distribuzione diversa dalla normale (e Mary ammette che ciò è dubbio nei suoi dati), avresti un fattore diverso. Ottenere la stima mediananon è un grosso problema, anche se puoi iniziare a soffrire per i valori medi per il numero pari di osservazioni rispetto a invertire il cdf o qualcosa del genere. Il valore di densità rilevante può essere stimato dagli stimatori di densità del kernel , se necessario. Nel complesso, questo ovviamente è relativamente dubbio poiché vengono prese tre approssimazioni:
Più bassa è la dimensione del campione, più diventa dubbia.