So che potrebbe essere un po 'complicato, statisticamente, ma questo è il mio problema.
Ho molti dati di intervallo, vale a dire la dimensione minima, massima e di campionamento di una variabile. Per alcuni di questi dati ho anche una media, ma non molti. Voglio confrontare questi intervalli tra loro per quantificare la variabilità di ciascun intervallo e anche confrontare i mezzi. Ho una buona ragione per presumere che la distribuzione sia simmetrica rispetto alla media e che i dati avranno una distribuzione gaussiana. Per questo motivo sto pensando di poter giustificare l'uso del punto medio della distribuzione come proxy per la media, quando è assente.
Quello che voglio fare è ricostruire una distribuzione per ogni intervallo e quindi usarla per fornire una deviazione standard o un errore standard per quella distribuzione. Le uniche informazioni che ho sono il massimo e il minimo osservati da un campione e il punto medio come proxy per la media.
In questo modo spero di essere in grado di calcolare le medie ponderate per ciascun gruppo, e anche di elaborare il coefficiente di variazione anche per ciascun gruppo, in base ai dati di intervallo che ho e alle mie ipotesi (di una distribuzione simmetrica e normale).
Ho intenzione di usare R per fare questo, quindi anche qualsiasi aiuto sul codice sarebbe apprezzato.