Buoni libri / documenti sul punteggio di credito


11

Sto cercando raccomandazioni di libri sul punteggio di credito. Sono interessato a tutti gli aspetti di questo problema, ma principalmente a: 1) Buone funzionalità. Come costruirli? Quali si sono dimostrati buoni? 2) Reti neurali. La loro applicazione al problema del punteggio di credito. 3) Ho scelto le reti neurali, ma sono interessato anche ad altri metodi.


Risposte:


6

Se sei nuovo nel mondo del punteggio, il tuo primo libro dovrebbe essere naeem siddiqi sul punteggio del credito usando SAS. Se non hai preso la lezione, provaci. L'obiettivo principale della classe è la comprensione generale del punteggio e della vendita del minatore aziendale SAS per milioni di dollari.

Se hai bisogno di teoria, hai bisogno di un'analisi categorica dei dati e di una classe di data mining da un'università vicina. Anche dopo aver seguito queste lezioni avrai ancora bisogno di aiuto.

attualmente sono le tecniche più popolari utilizzate

  1. regressione logistica
  2. reti neurali
  3. supportare macchine vettoriali e
  4. foreste casuali

clustering, analisi discriminante, analisi dei fattori, componenti principali sono anch'essi indispensabili.

Anche il punteggio di credito di Elizabeth Mays ti darà una buona panoramica.

Ho anche preso una classe di modellizzazione del rischio di credito dall'istituto SAS, che mi ha aiutato un po '. È un processo di apprendimento costante e non è mai stato fatto.

Alla gente bayesiana piacciono anche i loro metodi.

modificare

ho anche dimenticato di menzionare. La regressione logistica nella tecnica più popolare in circolazione e sarà sempre quella che le banche continueranno a utilizzare. Altri metodi sono molto difficili da vendere agli alti dirigenti, a meno che la tua banca non sia interessata meno alla comprensione di questi metodi e alla loro attenzione rimanga l'assunzione di rischi e il guadagno.


Grazie! Chiarirò: sto partecipando a una competizione online, dove l'obiettivo è prevedere la probabilità di inadempienza di un mutuatario. Quindi 1) Sono libero di scegliere qualsiasi metodo che mi piace. La competizione termina tra 2 settimane, 2) Non ho molto tempo per fare un apprendimento completo. e 3) I dati forniti sono risposte grezze da agenzie di credito su crediti precedenti, quindi sono davvero interessato a estrarre funzionalità non ovvie da questi dati.
Nya,

Inoltre, grazie per la tua risposta, darò sicuramente un'occhiata ai tuoi riferimenti.
Nya,

1
Cos'è quella competizione? Posso sapere?
xiaodai,

6

Lavoro nel settore del credit scoring. Anche se mi piace esplorare approcci diversi, trovo che la regressione logistica sia spesso abbastanza buona se non l'approccio migliore. Non ho esaminato gli articoli più recenti sull'argomento, ma dalla memoria nella maggior parte degli articoli vedrai che altri approcci come il modello di reti neurali in genere non offrono un aumento significativo in termini di potere predittivo (misurato da GINI e AR). Inoltre, questi modelli tendono ad essere molto più difficili da dare un senso a un laico (spesso i dirigenti più anziani non hanno un background nelle statistiche) e l'approccio scorecard che utilizza la regressione logistica sembra offrire i modelli più facili da spiegare. È vero, la maggior parte dei segnapunti non tiene conto delle interazioni,

Detto questo, recentemente ci sono stati alcuni interessi nella costruzione di scorecard usando tecniche di analisi della sopravvivenza in quanto presenta alcuni vantaggi rispetto alla regressione logistica. Vale a dire, possiamo incorporare più facilmente i fattori macroeconomici nel modello, possiamo usare i dati più recenti nella costruzione del modello invece di dover fare affidamento sui dati almeno 12 mesi fa (poiché l'indicatore binario nella logistica è generalmente definito come predefinito nel prossimi 12 mesi). A questo proposito la mia tesi potrebbe offrire un'altra prospettiva in quanto esplora la costruzione di scorecard di credito utilizzando l'analisi di sopravvivenza. Ho mostrato come le scorecard dell'analisi di sopravvivenza "appaiono e sentono" le stesse delle scorecard di regressione logistica, quindi possono essere introdotte senza causare troppi problemi.

Nella mia tesi ho anche descritto l'algoritmo ABBA che è un nuovo approccio al binning delle variabili.

https://www.google.com.sg/url?sa=t&rct=j&q=&esrc=s&source=web&cd=1&cad=rja&ved=0CDAQFjAA&url=http%3A%2F%2Fftpmirror.your.org%2Fpub%2Fwikimedia%2Fimages% 2Fwikipedia% 2Fcommons% 2F2% 2F2f% 2FAbout_Time _-_ Building_Credit_Scorecards_with_Survival_Analysis.pdf & ei = 8D8MUorrJs2Trgf56YCwCQ & USG = AFQjCNGxWRH1naJS4UqH_ckwzTx3GsaP8g & SIG2 = kcEvjUUcn_wT93igxpYYDA & BVM = bv.50768961, d.bmk

Aggiornamento: non pretendo se la mia tesi sia valida. È solo un'altra prospettiva di un praticante sul campo.


1
Questo non sembra focalizzato sulla domanda. Il tuo suggerimento concreto è "leggi la mia tesi". Non l'ho letto e non sono qualificato per valutarlo, ma non si qualifica come un libro o addirittura un documento pubblicato.
Nick Cox,

4
@Nick La domanda richiede "altri metodi" a cui questa risposta affronta. Molte persone trovano utile un link a un testo scaricabile, forse anche più di un semplice riferimento. Per un flagger anonimo: fornire un collegamento al proprio lavoro non è spam. Diamo il benvenuto a ricercatori e altri innovatori qui e non vorremmo limitare le loro capacità di aiutarci richiedendo che non citino mai il proprio contributo!
whuber

3
Prendo il punto @ whuber. Sono anche pienamente d'accordo sul fatto che citare il proprio lavoro sia in ordine. xiaodai: rimuoverei l'aggiornamento. Il punto centrale del tuo post è che la tua tesi potrebbe valere la pena di essere letta. Se non la pensassi così, non pubblicheresti. Non è necessario aggiungere una nota di diffidenza o modestia.
Nick Cox,

3
  • Ho fatto riferimento alla Guida al credit scoring in R di D. Sharma in passato ed è un buon riferimento introduttivo su approcci tra cui regressione logistica e metodi basati su alberi
  • La guida di cui sopra utilizza i dati di credito tedeschi che presentano un ricco set di funzionalità. Se cerchi il set di dati, troverai altri approcci, analisi e confronti alternativi che possono aiutare a informare la selezione delle caratteristiche e la scelta del modello per il tuo set di dati
  • Le reti neurali sono una scelta giusta per un problema di classificazione binaria come questo. Nel mondo reale, un modello di valutazione del credito dovrebbe anche fornire ragioni per cui una domanda di prestito (diciamo) è stata respinta. Pertanto aiuta ad avere un modello in cui è possibile identificare quali caratteristiche della propria storia creditizia comportano un punteggio di credito basso e causano il rifiuto di un'applicazione. Le caratteristiche della regressione e degli approcci basati sugli alberi sono più facili da interpretare rispetto alle reti neurali. Se stai valutando esclusivamente l'adattamento, vale la pena provare NN
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.