Di recente ho ricevuto una revisione per il mio documento di ricerca e quanto segue è il commento del recensore sul mio documento:
i risultati ottenuti da un modello non sono abbastanza convincenti, in particolare la regressione lineare di solito presenta carenze nella gestione dei valori anomali. Suggerisco anche agli autori di provare la regressione logistica e di confrontare i risultati corrispondenti con i risultati attuali. Se si ottengono osservazioni simili, i risultati sarebbero più solidi.
Il commento del recensore è giusto? La regressione logistica è migliore della regressione lineare multipla?
Il problema è che la mia variabile dipendente non è categorica, è una variabile di scala. Cosa posso fare ora? Quale altro metodo di regressione mi consiglia di valutare il mio modello?
Il punteggio è variabile dipendente nella seguente tabella. Recency, frequenza, mandato e ultimo punteggio sono variabili indipendenti.
Ho estratto queste variabili da un sito e ipotizzo che queste variabili indipendenti abbiano un effetto significativo sul punteggio . Pertanto, rappresento i seguenti modelli:
A proposito, il valore di R al quadrato per questo modello lineare è 0,316! Anche il revisore ha commentato questo valore:
quindi i risultati non sono convincenti in quanto non esiste alcun indicatore sulla qualità dei coefficienti appresi. Un piccolo R ^ 2 non può indicare buone prestazioni in quanto il modello potrebbe essere montato eccessivamente.
0.316 è molto basso per R al quadrato? Nei precedenti articoli ho visto molti valori simili.