[NB: Vedi l'aggiornamento 1 di seguito.] Trovo che la metodologia rpart
sia molto più semplice da spiegare rispetto a party
. Quest'ultimo, tuttavia, è molto più sofisticato e probabilmente offre modelli migliori. Il modo in cui talvolta spiego party
è di parlarne come base per la produzione di modelli locali lineari (o GLM). Costruisco su questo sottolineando che i risultati per rpart
sono costanti su tutti gli elementi che cadono nel nodo foglia, ovvero la casella / regione delimitata dalle divisioni. Anche se potrebbero esserci miglioramenti tramite modelli locali, non si ottiene altro che una previsione costante.
Al contrario, party
sviluppa le divisioni per ottimizzare potenzialmente i modelli per le regioni. In realtà sta usando criteri diversi dall'ottimalità del modello, ma è necessario valutare la propria capacità di spiegare la differenza per determinare se è possibile spiegarlo bene. I documenti per questo sono piuttosto accessibili per un ricercatore, ma possono essere piuttosto impegnativi per qualcuno che non è disposto a prendere in considerazione metodi più semplici come foreste casuali, potenziamento, ecc. Matematicamente, penso che party
sia più sofisticato ... Tuttavia, i modelli CART sono più facili da spiegare, sia in termini di metodologia che di risultati, e questi forniscono un decente trampolino di lancio per l'introduzione di modelli basati su alberi più sofisticati.
In breve, direi che devi fare rpart
per chiarezza e puoi usare party
per accuratezza / prestazioni, ma non introdurrei party
senza presentarti rpart
.
Aggiornamento 1. Ho basato la mia risposta sulla mia comprensione di party
come era un anno o due fa. È cresciuto un po ', ma modificherei la mia risposta per dire che consiglierei ancora rpart
per la sua brevità e eredità, se "non fantasioso" dovrebbe essere un criterio importante per il tuo cliente / collaboratore. Tuttavia, proverei a migrare per utilizzare più funzionalità da party
, dopo aver introdotto qualcuno a rpart
. È meglio iniziare in piccolo, con funzioni di perdita, criteri di suddivisione, ecc., In un contesto semplice, prima di introdurre un pacchetto e una metodologia che coinvolgono concetti molto più coinvolti.