Ciò di cui hai bisogno è una solida revisione della metodologia di regressione. Tuttavia, queste domande sono sufficientemente basilari (non prenderle nel modo sbagliato) che probabilmente anche una buona panoramica delle statistiche di base potrebbe trarne beneficio. Howell ha scritto un libro di testo molto popolare che fornisce un'ampia base concettuale senza richiedere una densa matematica. Potrebbe valere la pena leggerlo. Non è possibile coprire tutto quel materiale qui. Tuttavia, posso provare a iniziare con alcune delle tue domande specifiche.
Innanzitutto, i giorni della settimana sono inclusi tramite uno schema di codifica. Il più popolare è la codifica della "categoria di riferimento" (in genere chiamata codifica fittizia). Immaginiamo che i tuoi dati siano rappresentati in una matrice, con i tuoi casi in righe e le tue variabili in colonne. In questo schema, se avessi 7 variabili categoriali (ad esempio, per i giorni della settimana) aggiungeresti 6 nuove colonne. Sceglieresti un giorno come categoria di riferimento, generalmente quella considerata come predefinita. Spesso questo è informato dalla teoria, dal contesto o dalla domanda di ricerca. Non ho idea di quale sarebbe la cosa migliore per i giorni della settimana, ma non ha molta importanza, potresti sceglierne una qualsiasi. Una volta che hai la categoria di riferimento, puoi assegnare gli altri alle tue nuove 6 variabili, quindi indichi semplicemente se quella variabile ottiene per ogni caso. Ad esempio, supponi di scegliere Domenica come categoria di riferimento, le tue nuove colonne / variabili saranno dal lunedì al sabato. Ogni osservazione che ha avuto luogo un lunedì sarebbe indicata con a1010
È passato molto tempo da quando ho visto come Excel fa le statistiche e non me lo ricordo molto chiaramente, quindi qualcun altro potrebbe essere in grado di aiutarti di più lì. Questa pagina sembra avere alcune informazioni sulle specifiche della regressione in Excel. Posso dirti un po 'di più sulle statistiche tipicamente riportate nell'output di regressione:
- r1
- rrrrr
- rr×r10r1R21rR2) è fortemente influenzato dalla regressione multipla. Cioè, più predittori aggiungi al tuo modello, più alte saranno queste statistiche, indipendentemente dal fatto che ci sia o meno una relazione. Quindi dovresti essere cauto nell'interpretarli.
- tF
- p
- tFpF1F
- FF
Un ultimo punto che vale la pena sottolineare è che questo processo non può essere divorziato dal suo contesto. Per fare un buon lavoro di analisi dei dati, devi tenere a mente le tue conoscenze di base e la domanda di ricerca. Ho accennato a questo sopra per quanto riguarda la scelta della categoria di riferimento. Ad esempio, noti che il numero di scarpe non dovrebbe essere rilevante, ma per i Flintstones probabilmente lo era! Voglio solo includere questo fatto, perché spesso sembra essere dimenticato.