Le stime dei parametri, come una media campionaria o un coefficiente di regressione OLS, sono statistiche campionarie che utilizziamo per trarre inferenze sui corrispondenti parametri della popolazione. I parametri di popolazione sono ciò che ci interessa davvero, ma poiché non abbiamo accesso a tutta la popolazione (di solito ritenuta infinita), dobbiamo invece utilizzare questo approccio. Tuttavia, ci sono alcuni fatti scomodi che derivano da questo approccio. Ad esempio, se prendessimo un altro campione e calcolassimo la statistica per stimare nuovamente il parametro, scopriremmo quasi sicuramente che differisce. Inoltre, nessuna delle due stime corrisponde probabilmente al vero valore del parametro che vogliamo conoscere. In effetti, se lo facessimo ripetutamente, continuando a campionare e stimare per sempre, scopriremmo che la frequenza relativa dei diversi valori di stima seguiva una distribuzione di probabilità. Il teorema del limite centrale suggerisce che è probabile che questa distribuzione sia normale. Abbiamo bisogno di un modo per quantificare la quantità di incertezza in tale distribuzione. Ecco cosa fa l'errore standard per te.
Nel tuo esempio, vuoi conoscere la pendenza della relazione lineare tra x1 e y nella popolazione, ma hai accesso solo al tuo campione. Nel tuo campione, quella pendenza è .51, ma senza sapere quanta variabilità c'è nella sua corrispondente distribuzione di campionamento , è difficile sapere cosa fare di quel numero. L'errore standard, in questo caso 0,05, è la deviazione standard di quella distribuzione di campionamento. Per calcolare la significatività, dividi la stima per SE e cerca il quoziente nella tabella. Pertanto, gli ES più grandi significano un significato inferiore .
La deviazione standard residua non ha nulla a che fare con le distribuzioni campionarie delle tue pendenze. È solo la deviazione standard del campione a seconda del modello. Non c'è contraddizione, né potrebbe esserci. Per quanto riguarda il modo in cui hai una SD più grande con un R ^ 2 elevato e solo 40 punti dati, immagino che tu abbia l'opposto della limitazione dell'intervallo - i tuoi valori x sono sparsi molto ampiamente.