Immagina di essere un medico in un'unità di terapia intensiva. Hai un paziente con una forte febbre e un determinato numero di cellule del sangue e un dato peso corporeo e un centinaio di dati diversi e vuoi prevedere se sopravviverà. Se sì, nasconderà quella storia dell'altro figlio a sua moglie, in caso contrario, è importante che lo riveli, mentre può.
Il medico può fare questa previsione in base ai dati degli ex pazienti che aveva nella sua unità. Sulla base delle sue conoscenze di software, può prevedere utilizzando una regressione lineare generalizzata (glm) o tramite una rete neurale (nn).
1. Modello lineare generalizzato
Esistono molti parametri correlati per il glm, quindi per arrivare a un risultato, il medico dovrà fare ipotesi (linearità ecc.) E decisioni su quali parametri possono avere un'influenza. Il glm lo ricompenserà con un t-test di significato per ciascuno dei suoi parametri in modo che possa raccogliere forti prove, che il genere e la febbre hanno un'influenza significativa, il peso corporeo non è necessariamente così.
2. Rete neurale
La rete neurale inghiottirà e digerirà tutte le informazioni che ci sono nel campione di ex pazienti. Non importa se i predittori sono correlati e non rivelerà molte informazioni, se l'influenza del peso corporeo sembra essere importante solo nel campione a portata di mano o in generale (almeno non a livello di competenza che il medico ha da offrire). Calcolerà solo un risultato.
Cosa c'è di meglio
Quale metodo scegliere dipende dall'angolazione da cui si guarda al problema: come paziente, preferirei la rete neurale che utilizza tutti i dati disponibili per una migliore ipotesi su ciò che accadrà a me senza ipotesi forti e ovviamente sbagliate come la linearità. Come medico, che vuole presentare alcuni dati in un diario, ha bisogno di valori p. La medicina è molto conservatrice: chiederanno valori p. Quindi il medico vuole riferire che in tale situazione il genere ha un'influenza significativa. Per il paziente, non importa, basta usare qualsiasi influenza che il campione suggerisce sia più probabile.
In questo esempio, il paziente vuole la predizione, il lato scienziato del dottore vuole l'inferenza. Principalmente, quando vuoi capire un sistema, allora l'inferenza è buona. Se è necessario prendere una decisione in cui non è possibile comprendere il sistema, la previsione dovrà essere sufficiente.