Dopo aver cercato chiarimenti sui coefficienti del modello lineare qui, ho una domanda di follow-up riguardante i non significativi (alto valore p) per i coefficienti dei livelli dei fattori.
Esempio: se il mio modello lineare include un fattore con 10 livelli e solo 3 di quei livelli hanno valori p significativi associati ad essi, quando si usa il modello per prevedere Y, posso scegliere di non includere il termine del coefficiente se il soggetto rientra in uno di il livello non significativo?
Più drasticamente, sarebbe sbagliato raggruppare i 7 livelli non significativi in un livello e riesaminarli?