In uno degli esercizi per il mio corso, stiamo usando un set di dati medici Kaggle .
L'esercizio dice:
vogliamo modellare la distribuzione dei singoli addebiti e vogliamo anche davvero essere in grado di catturare la nostra incertezza su tale distribuzione in modo da poter meglio catturare l'intervallo di valori che potremmo vedere. Caricamento dei dati ed esecuzione di una vista iniziale:
Potremmo sospettare da quanto sopra che ci sia una sorta di distribuzione esponenziale in gioco qui. ... Le spese per i sinistri possono essere multimodali. La distribuzione gamma potrebbe essere applicabile e potremmo verificarla per la distribuzione di oneri che non erano i reclami assicurativi per primi.
Ho cercato "Distribuzione gamma" e ho trovato "una distribuzione continua, solo positiva, unimodale che codifica il tempo necessario affinché eventi« alfa »si verifichino in un processo di Poisson con tempo medio di arrivo di« beta »"
Qui non c'è tempo, solo spese non correlate, assicurate o meno.
Perché dovrebbero scegliere una distribuzione gamma?