Le interazioni sono utili solo nel contesto della regressione?


11

Ho sempre letto il termine interazione nel contesto della regressione. Dovremmo anche considerare le interazioni con modelli diversi, ad esempio knn o svm?

Se ci sono , 100 o anche più funzioni e diciamo 1000 osservazioni, qual è il solito modo per trovare interazioni utili? Prova tutte le combinazioni? O utilizzare solo combinazioni che hanno senso?501001000


Una risposta è che le interazioni che riducono VIF possono essere utili.
Carl,

(+1) Per fare una domanda utile.
Carl

Risposte:


1

XiXj

Il modo più semplice per vederlo è attraverso il problema XOR, un modello di regressione senza interazioni non può risolverlo, poiché richiede una combinazione non lineare.

D'altra parte, KNN e SVM (e molti altri modelli) sono approssimatori di funzioni universali. Ciò significa che non possono solo combinare i loro input in modo lineare, ma anche in qualsiasi modo non lineare. A cui sono dati abbastanza layer o un kernel adatto, possono sostanzialmente "creare" le proprie interazioni, esattamente come ne hanno bisogno. Se sai o ti aspetti che interazioni specifiche siano importanti, puoi comunque usarle come input per guidare i modelli nella giusta direzione.

Allo stesso modo, i modelli basati su alberi possono essere interpretati come costituiti solo da interazioni. Fondamentalmente, una divisione in un modello basato su albero crea un'interazione specifica con tutte le variabili precedenti.

N2N


1

No.

(x1,x2)(x12,x22,x1x2)

1010

Pertanto, non solo l'interazione è stata ampiamente utilizzata in altri modelli. In aggiunta all'interazione, altri modelli cercano di ottenere di più con l'ingegnerizzazione delle funzionalità. Invece della moltiplicazione di due colonne, vengono derivate funzionalità più complicate.


0

Interazioni che migliorano l'R-quadrato rettificato, il BIC per la regressione della probabilità (in alternativa AICc e altri), VIF e la statistica F di ANOVA, quest'ultima senza parametri individuali che vengono giudicati non contributivi utilizzando le loro probabilità parziali.

Anche molto importante, ma non è stato chiesto, è che la riparameterizzazione può migliorare notevolmente sia l'effetto delle singole variabili sia le loro interazioni. Tuttavia, le misurazioni della qualità BIC, AIC e altre probabilità non sono valide per confrontare diverse riparazioni che lasciano rettificato R-quadrato, VIF e statistica F di ANOVA per tali scopi.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.