Se ha più di due categorie, la tua domanda sul "vantaggio" di una regressione rispetto all'altra è probabilmente priva di significato se miri a confrontare i parametri dei modelli , perché i modelli saranno sostanzialmente diversi:Y
per ognilogistica binariaregressione elogP(i)P(not i)=logiti=linear combinationi
iri≠rlogP(i)P(r)=logiti=linear combination per ogni categoria in multipla logistica di regressione, essendo la categoria di riferimento prescelto ( ).iri≠r
Tuttavia, se il vostro obiettivo è solo quello di prevedere la probabilità di ogni categoria entrambi gli approcci è giustificata, anche se si possono dare diverse stime di probabilità. La formula per stimare una probabilità è generica:i
i,j,…,rrexp(logit)=1P′(iP'( io) = e x p ( l o g i tio)e x p ( l o g i tio) + e x p ( l o g i tj) + ⋯ + e x p ( l o g i tr) , dove sono tutte le categorie, e se stato scelto per essere quello di riferimento, è . Quindi, per la logistica binaria quella stessa formula diventa . La logistica multinomiale si basa sul presupposto (non sempre realistico) dell'indipendenza di alternative irrilevanti, mentre una serie di previsioni logistiche binarie no.io , j , ... , rre x p ( l o g i t ) = 1P'( i ) = e x p ( l o g i tio)e x p ( l o g i tio)+1
Un tema separato è quali sono le differenze tecniche tra regressioni logistiche multinomiali e binarie nel caso in cui sia dicotomico . Ci saranno differenze nei risultati? Il più delle volte in assenza di covariate i risultati saranno gli stessi, tuttavia ci sono differenze negli algoritmi e nelle opzioni di output. Vorrei solo citare la Guida di SPSS su tale problema in SPSS:Y
I modelli di regressione logistica binaria possono essere adattati utilizzando la procedura di regressione logistica o la procedura di regressione logistica multinomiale. Ogni procedura ha opzioni non disponibili nell'altra. Una distinzione teorica importante è che la procedura di regressione logistica produce tutte le previsioni, i residui, le statistiche sull'influenza e i test di bontà di adattamento utilizzando i dati a livello di singolo caso, indipendentemente dal modo in cui i dati vengono immessi e dal fatto che il numero di modelli di covariata sia o meno è inferiore al numero totale di casi, mentre la procedura di regressione logistica multinomiale aggrega internamente i casi per formare sottopopolazioni con identici schemi di covariata per i predittori, producendo previsioni, residui e test di bontà di adattamento basati su queste sottopopolazioni.
La regressione logistica offre le seguenti caratteristiche uniche:
• Test di Hosmer-Lemeshow sulla bontà di adattamento per il modello
• Analisi graduali
• Contrasti per definire la parametrizzazione del modello
• Punti di taglio alternativi per la classificazione
• Grafici di classificazione
• Modello montato su una serie di custodie su una serie di astucci
• Salva previsioni, residui e statistiche di influenza
La regressione logistica multinomiale offre le seguenti caratteristiche uniche:
• Test chi-quadrati di Pearson e devianza per la bontà di adattamento del modello
• Specifica delle sottopopolazioni per il raggruppamento di dati per i test di bontà di adattamento
• Elenco di conteggi, conteggi previsti e residui per sottopopolazioni
• Correzione delle stime di varianza per eccesso di dispersione
• Matrice di covarianza delle stime dei parametri
• Test di combinazioni lineari di parametri
• Specifica esplicita di modelli nidificati
• Adatta modelli di regressione logistica condizionale abbinati 1-1 utilizzando variabili differenziate