Tradizionalmente, l'inferenza statistica viene insegnata nel contesto dei campioni di probabilità e della natura dell'errore di campionamento. Questo modello è la base per il test di significatività. Tuttavia, ci sono altri modi per modellare le partenze sistematiche dal caso e risulta che i nostri test parametrici (basati sul campionamento) tendono ad essere buone approssimazioni di queste alternative.
I test parametrici delle ipotesi si basano sulla teoria del campionamento per produrre stime del probabile errore. Se un campione di una determinata dimensione viene prelevato da una popolazione, la conoscenza della natura sistematica del campionamento rende significativi i test e gli intervalli di confidenza. Con una popolazione, la teoria del campionamento non è semplicemente rilevante e i test non sono significativi in senso tradizionale. L'inferenza è inutile, non c'è nulla da dedurre, c'è solo la cosa ... il parametro stesso.
Alcuni lo aggirano facendo appello alle superpopolazioni che rappresenta l'attuale censimento. Trovo questi appelli poco convincenti: i test parametrici si basano sul campionamento di probabilità e sulle sue caratteristiche. Una popolazione in un dato momento può essere un campione di una popolazione più ampia nel tempo e nel luogo. Tuttavia, non vedo in alcun modo che si possa legittimamente sostenere che si tratti di un campione casuale (o più in generale di qualsiasi forma di probabilità). Senza un campione di probabilità, la teoria del campionamento e la logica tradizionale dei test semplicemente non si applicano. Puoi anche testare sulla base di un campione di convenienza.
Chiaramente, per accettare i test quando si utilizza una popolazione, è necessario rinunciare alla base di tali test nelle procedure di campionamento. Un modo per farlo è riconoscere la stretta connessione tra i nostri test teorici di esempio - come t, Z e F - e le procedure di randomizzazione. I test di randomizzazione si basano sul campione a portata di mano. Se raccolgo dati sul reddito di maschi e femmine, il modello di probabilità e la base per le nostre stime di errore vengono ripetute allocazioni casuali dei valori dei dati effettivi. Potrei confrontare le differenze osservate tra i gruppi con una distribuzione basata su questa randomizzazione. (Lo facciamo sempre in esperimenti, tra l'altro, in cui il campionamento casuale da un modello di popolazione è raramente appropriato).
Ora, risulta che i test teorici di esempio sono spesso buone approssimazioni dei test di randomizzazione. Quindi, in definitiva, penso che i test delle popolazioni siano utili e significativi in questo quadro e possano aiutare a distinguere la variazione sistematica dalla variazione casuale, proprio come con i test basati su campioni. La logica utilizzata per arrivarci è un po 'diversa, ma non influisce molto sul significato pratico e sull'uso dei test. Naturalmente, potrebbe essere meglio usare i test di randomizzazione e di permutazione direttamente dato che sono facilmente disponibili con tutta la nostra moderna potenza di calcolo.