Perché il RANSAC non è più utilizzato nelle statistiche?


26

Provenendo dal campo della visione artificiale, ho spesso usato il metodo RANSAC (Random Sample Consensus) per adattare i modelli ai dati con molti valori anomali.

Tuttavia, non l'ho mai visto usato dagli statistici e ho sempre avuto l'impressione che non fosse considerato un metodo "statisticamente valido". Perchè è così? È di natura casuale, il che rende più difficile l'analisi, ma lo sono anche i metodi di bootstrap.

O è semplicemente un caso di silos accademici che non parlano tra loro?


1
Mi chiedo una cosa sui metodi di visione artificiale rispetto ai metodi statistici: le prestazioni nella prima sono un must. Forse c'è un compromesso tra prestazioni e "correttezza", e la visione artificiale e le statistiche hanno pesi diversi per quelle variabili.
Lucas Reis,

Risposte:


10

Penso che la chiave qui sia lo scarto di gran parte dei dati in RANSAC.

Nella maggior parte delle applicazioni statistiche, alcune distribuzioni possono avere code pesanti e, pertanto, piccoli numeri di campione possono distorcere la stima statistica. Stimatori affidabili risolvono questo problema pesando i dati in modo diverso. D'altra parte, RANSAC non tenta di soddisfare i valori anomali, è costruito per i casi in cui i punti di dati non appartengono realmente, non solo per la distribuzione non normale.


1
Bella risposta. Ho visto RANSAC più utilizzato nel CV per stimare le omografie. Questo è ampiamente utilizzato quando sappiamo che alcune delle misurazioni corrispondenti sono estremamente inaffidabili. Inoltre, le prestazioni in tempo reale e altre considerazioni hanno reso questa tecnica abbastanza popolare in quanto può essere facilmente parallelizzata.
Luca

7

Per noi, è solo un esempio di una forte regressione - credo che sia utilizzato anche dagli statistici, ma forse non così ampio perché ha alcune alternative meglio conosciute.


1
Puoi dare esempi di alternative? Mi piacerebbe esaminarlo.
Bossykena,

5
Il più noto e il più semplice è la regressione mediano-mediana, ben nota dai calcolatori intelligenti (Sigh!). Consulta anche Wikipedia en.wikipedia.org/wiki/Robust_regression e forse la visualizzazione attività robusta di CRAN cran.r-project.org/web/views/Robust.html

Esistono alternative a RANSAC che offrono non solo la regressione imparziale, ma anche i punti dati da cui è stato stimato il modello? Grazie
Valerio,

2

Questo suona molto come l' insacco, che è una tecnica usata frequentemente.


3
RANSAC è molto diverso: nell'insaccamento, tutti i campioni sono presi in considerazione in qualche modo. RANSAC viene utilizzato nei casi in cui fino al 50% dei dati deve essere completamente eliminato.
nbubis,

1

Getti via i dati con RANSAC, potenzialmente senza giustificarli, ma basandoti sull'aumento dell'adattamento del modello. Gettare via i dati per una maggiore vestibilità è di solito evitato in quanto si possono perdere dati importanti. La rimozione di valori anomali senza giustificazione è sempre problematica.

È ovviamente possibile giustificarlo. Ad esempio, se sapevi che i dati dovrebbero seguire un determinato modello, ma che ci sono anche deviazioni nei dati dal modello a causa di un errore nelle misurazioni.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.