Differenzierò le analisi usando errori basati su modelli rispetto a solidi standard facendo riferimento a questi ultimi come "GEE" che è in realtà una definizione scambiabile. Oltre alla fantastica spiegazione di Scortchi:
I GEE possono essere "distorti" in piccoli campioni, ovvero 10-50 soggetti: (Lipsitz, Laird e Harrington, 1990; Emrich e Piedmonte, 1992; Sharples e Breslow, 1992; Lipsitz et al., 1994; Qu, Piedmonte e Williams, 1994; Gunsolley, Getchell e Chinchilli, 1995; Sherman e le Cessie, 1997.) Quando dico che i GEE sono distorti, intendo che la stima dell'errore standard può essere conservativa o anticonservativa a causa di conteggi di cellule piccole o nulle , a seconda di quali valori adattati presentano questo comportamento e quanto sono coerenti con la tendenza generale del modello di regressione.
In generale, quando il modello parametrico è correttamente specificato, si ottengono comunque stime di errore standard corrette dagli elementi della configurazione basati sul modello, ma il punto centrale dell'utilizzo di GEE è quello di accogliere un "if" molto grande. I GEE consentono allo statistico di specificare semplicemente un modello di probabilità di lavoro per i dati e i parametri (anziché essere interpretati nel quadro strettamente parametrico) sono considerati un tipo di "setaccio" in grado di generare valori riproducibili indipendentemente dalla generazione di dati sconosciuta sottostante meccanismo. Questo è il cuore e l'anima dell'analisi semi-parametrica, di cui un GEE ne è un esempio.
I GEE gestiscono anche fonti non misurate di covariazione nei dati, anche con la specifica di una matrice di correlazione indipendente. Ciò è dovuto all'uso della matrice di covarianza empirica piuttosto che basata su modelli. Nella modellazione di Poisson, ad esempio, potresti essere interessato ai tassi di fertilità del salmone prelevati da vari flussi. Gli ovuli raccolti da pesci femmine potrebbero avere una distribuzione di Poisson sottostante, ma le variazioni genetiche che comprendono l'ereditarietà condivisa e le risorse disponibili in flussi specifici potrebbero rendere i pesci all'interno di tali flussi più simili rispetto ad altri flussi. Il GEE fornirà stime di errore standard della popolazione corrette purché la frequenza di campionamento sia coerente con la proporzione della popolazione (o sia in altri modi stratificata).