Ho un sacco (circa 1000) di stime e si suppone che siano tutte stime di elasticità a lungo termine. Poco più della metà di questi viene stimata usando il metodo A e il resto usando un metodo B. Da qualche parte leggo qualcosa del tipo "Penso che il metodo B stima qualcosa di molto diverso dal metodo A, perché le stime sono molto più alte (50-60%) ". La mia conoscenza di statistiche affidabili non ha praticamente nulla, quindi ho calcolato solo le medie dei campioni e le mediane di entrambi i campioni ... e ho subito notato la differenza. Il metodo A è molto concentrato, la differenza tra mediana e media è molto piccola, ma il campione del metodo B è variato in modo selvaggio.
Ho concluso che gli errori anomali e gli errori di misurazione hanno distorto il campione del metodo B, quindi ho gettato via circa 50 valori (circa il 15%) che erano molto incoerenti con la teoria ... e improvvisamente i mezzi di entrambi i campioni (incluso il loro CI) erano molto simili . Trama anche la densità.
(Nella ricerca dell'eliminazione dei valori anomali, ho esaminato l'intervallo del campione A e rimosso tutti i punti campione in B che sono caduti al di fuori di esso.) Vorrei che mi dicessi dove potrei scoprire alcune basi di una solida stima dei mezzi che potrebbero mi permetta di giudicare questa situazione in modo più rigoroso. E per avere dei riferimenti. Non ho bisogno di una comprensione molto approfondita delle varie tecniche, piuttosto di leggere un sondaggio completo sulla metodologia della stima robusta.
I t-tested for significance of mean difference after removing the outliers and the p-value is 0.0559 (t around 1.9), for the full samples the t stat was around 4.5. But that is not really the point, the means can be a bit different, but they should not differ by 50-60% as stated above. And I don't think they do.