Come sottolineano i commenti alla tua domanda, ci sono molte persone che lavorano per trovare qualcosa di meglio. Vorrei però rispondere a questa domanda espandendo il commento lasciato da @josh
Tutti i modelli sono sbagliati ma alcuni sono utili (Wiki)
L'affermazione di cui sopra è una verità generale utilizzata per descrivere la natura dei modelli statistici. Utilizzando i dati disponibili, possiamo creare modelli che ci consentono di fare cose utili come approssimare un valore previsto.
Prendiamo ad esempio la regressione lineare
Usando una serie di osservazioni, possiamo adattare un modello per darci un valore approssimativo per una variabile dipendente dato qualsiasi valore (i) per le variabili indipendenti.
Burnham, KP; Anderson, DR (2002), Selezione del modello e modello multiplo> Inferenza: un approccio teorico-informativo pratico (2a edizione):
"Un modello è una semplificazione o approssimazione della realtà e quindi non rifletterà tutta la realtà ... Box ha osservato che" tutti i modelli sono sbagliati, ma alcuni sono utili ". Mentre un modello non può mai essere" verità ", un modello potrebbe essere classificato da molto utile, a utile, in qualche modo utile, infine, sostanzialmente inutile ".
Le deviazioni dal nostro modello (come si può vedere nell'immagine sopra) appaiono casuali, alcune osservazioni sono sotto la linea e alcune sono sopra, ma la nostra linea di regressione mostra una correlazione generale. Mentre le deviazioni nel nostro modello appaiono casuali, in scenari realistici ci saranno altri fattori in gioco che causano questa deviazione. Ad esempio, immagina di guardare le auto mentre attraversano un incrocio in cui devono girare a sinistra oa destra per continuare, le auto non girano in alcun modo particolare. Mentre potremmo dire che la direzione in cui girano le macchine è completamente casuale, ogni pilota raggiunge l'incrocio e a quel punto prende una decisione casuale su quale direzione svoltare? In realtà probabilmente si stanno dirigendo in un posto specifico per un motivo specifico e senza tentare di fermare ogni macchina per chiedere loro il loro ragionamento, possiamo solo descrivere le loro azioni come casuali.
Laddove siamo in grado di adattare un modello con una minima deviazione, quanto possiamo essere certi che una variabile sconosciuta, inosservata o incommensurabile non potrà a un certo punto lanciare il nostro modello? Il battito delle ali di una farfalla in Brasile fa scattare un tornado in Texas?
Il problema con l'utilizzo dei modelli Linear e SVN che menzioni da solo è che in qualche modo siamo tenuti ad osservare manualmente le nostre variabili e il modo in cui ognuna di esse si influenza reciprocamente. Dobbiamo quindi decidere quali variabili sono importanti e scrivere un algoritmo specifico per l'attività. Questo può essere semplice se abbiamo solo poche variabili, ma se ne avessimo migliaia? E se volessimo creare un modello di riconoscimento delle immagini generalizzato, questo potrebbe realisticamente essere raggiunto con questo approccio?
Le reti di apprendimento profondo e reti neurali artificiali (ANN) possono aiutarci a creare modelli utili per enormi set di dati contenenti enormi quantità di variabili (ad esempio librerie di immagini). Come dici tu, c'è un numero incomprensibile di soluzioni che potrebbero adattarsi ai dati usando le ANN, ma questo numero è davvero diverso dalla quantità di soluzioni di cui avremmo bisogno per svilupparci attraverso prove ed errori?
L'applicazione delle RNA svolge gran parte del lavoro per noi, possiamo specificare i nostri input e i risultati desiderati (e modificarli in seguito per apportare miglioramenti) e lasciare che sia la RNA a capire la soluzione. Questo è il motivo per cui le ANN sono spesso descritte come "scatole nere" . Da un dato input generano un'approssimazione, tuttavia (in termini generali) queste approssimazioni non includono dettagli su come sono state approssimate.
E quindi si riduce davvero a quale problema stai cercando di risolvere, poiché il problema determinerà quale approccio modello è più utile. I modelli non sono assolutamente precisi e quindi c'è sempre un elemento di "errore", tuttavia più accurati sono i risultati, più utili sono. Avere più dettagli nei risultati su come è stata fatta l'approssimazione può anche essere utile, a seconda del problema potrebbe anche essere più utile di una maggiore precisione.
Se, ad esempio, stai calcolando un punteggio di credito delle persone, l'utilizzo della regressione e degli SVM fornisce calcoli che possono essere esplorati meglio. Essere in grado sia di modificare direttamente il modello sia di spiegare ai clienti l'effetto che variabili indipendenti indipendenti hanno sul loro punteggio complessivo è molto utile. Una RNA può aiutare a elaborare grandi quantità di variabili per ottenere un punteggio più accurato, ma questa precisione sarebbe più utile?