Mi piace questa domanda perché arriva alla politica che esiste in ogni organizzazione. Dal mio punto di vista e in misura significativa, le aspettative in merito alle prestazioni del modello sono in funzione della cultura organizzativa e del grado in cui un'organizzazione è "tecnicamente competente". Un modo per chiarire cosa intendo è considerare le differenze tra le 4 grandi entità della "scienza dei dati" - Google, FB, Amazon e Yahoo - rispetto alle 4 grandi entità che detengono agenzie - WPP, Omnicon, Interbrand e Publicis. Google e altri sono molto tecnicamente competenti. Le agenzie, d'altra parte, sono note per la fobia tecnologica. Qual è la prova per questo? Prima di tutto, il gruppo tecnicamente competente è stato fondato o gestito da ingegneri, informatici, geek e persone con un forte background tecnologico. Chi gestisce le aziende analfabete tecnologiche? I professionisti del marketing che sono diventati famosi in virtù della loro comunicazione morbida e delle abilità delle persone. E non solo, avendo lavorato in alcuni di questi negozi a New York, posso testimoniare che queste organizzazioni puniscono sistematicamente e / o respingono i tipi altamente tecnicamente alfabetizzati come non "adatti" alla cultura. Successivamente, considera le loro capitalizzazioni aggregate (di borsa), il gruppo di esperti di tecnologia aggiunge fino a circa 800 miliardi di dollari, mentre il gruppo analfabeta di tecnologia ammonta a 80 miliardi. Le entità con competenze tecniche sono 10 volte più grandi delle altre nella capitalizzazione di mercato. Questa è una chiara dichiarazione delle aspettative del mercato e non è alta per gli analfabeti. Quindi, per estrapolazione, che tipo di speranza puoi avere per sfidare le aspettative di "accuratezza predittiva" di questo tipo di bozos? avendo lavorato in alcuni di questi negozi a New York, posso testimoniare che queste organizzazioni puniscono sistematicamente e / o respingono i tipi altamente tecnicamente competenti come non "adatti" alla cultura. Successivamente, considerate le loro capitalizzazioni aggregate (di borsa), il gruppo di esperti di tecnologia aggiunge fino a circa 800 miliardi di dollari, mentre il gruppo analfabeta di tecnologia ammonta a 80 miliardi. Le entità con competenze tecniche sono 10 volte più grandi delle altre nella capitalizzazione di mercato. Questa è una chiara dichiarazione delle aspettative del mercato e non è alta per gli analfabeti. Quindi, per estrapolazione, che tipo di speranza puoi avere per sfidare le aspettative di "accuratezza predittiva" di questo tipo di bozos? avendo lavorato in alcuni di questi negozi a New York, posso testimoniare che queste organizzazioni puniscono sistematicamente e / o respingono i tipi altamente tecnicamente competenti come non "adatti" alla cultura. Successivamente, considerate le loro capitalizzazioni aggregate (di borsa), il gruppo di esperti di tecnologia aggiunge fino a circa 800 miliardi di dollari, mentre il gruppo analfabeta di tecnologia ammonta a 80 miliardi. Le entità con competenze tecniche sono 10 volte più grandi delle altre nella capitalizzazione di mercato. Questa è una chiara dichiarazione delle aspettative del mercato e non è alta per gli analfabeti. Quindi, per estrapolazione, che tipo di speranza puoi avere per sfidare le aspettative di "accuratezza predittiva" di questo tipo di bozos? considerare le loro capitalizzazioni aggregate (di borsa), il gruppo di esperti di tecnologia aggiunge fino a circa 800 miliardi di dollari, mentre il gruppo analfabeta di tecnologia ammonta a 80 miliardi. Le entità con competenze tecniche sono 10 volte più grandi delle altre nella capitalizzazione di mercato. Questa è una chiara dichiarazione delle aspettative del mercato e non è alta per gli analfabeti. Quindi, per estrapolazione, che tipo di speranza puoi avere per sfidare le aspettative di "accuratezza predittiva" di questo tipo di bozos? considerare le loro capitalizzazioni aggregate (di borsa), il gruppo di esperti di tecnologia aggiunge fino a circa 800 miliardi di dollari, mentre il gruppo analfabeta di tecnologia ammonta a 80 miliardi. Le entità con competenze tecniche sono 10 volte più grandi delle altre nella capitalizzazione di mercato. Questa è una chiara dichiarazione delle aspettative del mercato e non è alta per gli analfabeti. Quindi, per estrapolazione, che tipo di speranza puoi avere per sfidare le aspettative di "accuratezza predittiva" di questo tipo di bozos?
Quindi, dato quel breakout culturale e in base a dove cadi, dovresti avere aspettative più o meno realistiche. Ovviamente, diverse entità "analfabete tecnologiche" avranno manager che sanno cosa stanno facendo, ma per la maggior parte, queste entità sono dominate dall'idiozia del minimo comune denominatore nelle competenze tecnologiche, cioè persone che sono al meglio tecniche semi-letterati (e pericolosi) o, più comunemente, totalmente innumerati ma non lo sanno. Caso in questione, ho lavorato per un ragazzo che voleva parole come "correlazione" cancellate dai deck c-suite. Questo è un caso estremo: dopo tutto, ogni segretario sa cos'è una "correlazione".
Ciò solleva il problema di come si affronta l'ingenuità ingenua e innumerevole quando si pongono una domanda davvero stupida come "Perché non si ottiene una precisione predittiva del 99%?" Una buona risposta è rispondere con una domanda del tipo: "Perché dovresti presumere che un PA così irrealisticamente elevato sia persino possibile?" Un altro potrebbe essere: "Perché se avessi effettivamente il 99% di PA, avrei pensato che stavo facendo qualcosa di sbagliato". Che è altamente probabile che sia vero, anche con il 90% di PA.
C'è la domanda più fondamentale dell'insistenza sull'AP come unico criterio per il valore del modello. Il compianto Leo Breiman ha lasciato molte impronte sulla comunità di modelli statistici e predittivi di cui PA è una. La sua principale preoccupazione con la PA era quella di rispondere alle molte critiche avanzate negli anni '90 riguardo all'instabilità e all'errore insiti nell'esecuzione di un singolo albero CART. La sua soluzione era quella di motivare le "foreste casuali" come metodo approssimativo e provvisorio che massimizzasse l'accuratezza e ridurrebbe l'instabilità eliminando la struttura ad albero. Ha confrontato il MSE inferiore da ~ 1.000 "mini-modelli" RF iterativi rispetto all'errore di un singolo modello di regressione logistica. L'unico problema era che non si era mai preso la briga di menzionare il paragone tra mele e arance:
Il Premio Netflix del 2008 ha offerto una considerevole ricompensa in denaro a qualsiasi statistico o team in grado di migliorare l'MSE del loro sistema di raccomandazione. All'epoca Netflix spendeva 150 milioni di dollari all'anno su questo sistema, convinto che i costi fossero più che recuperati nella fidelizzazione dei clienti e nell'acquisto di film che altrimenti non sarebbero mai stati scelti. Gli eventuali vincitori hanno utilizzato un complesso complesso di 107 modelli diversi.
Tuttavia, come ha appreso Netflix, il vero problema era che, dal punto di vista dei costi a pieno carico, l'effettivo miglioramento dell'errore rispetto al loro modello attuale era una semplice riduzione dello 0,005% nelle valutazioni a 5 punti. Per non parlare del fatto che i costi IT nel tempo, il sollevamento di carichi pesanti e la manutenzione dell'ensemble vincente di 107 modelli hanno più che annullato qualsiasi vantaggio derivante dalla riduzione degli errori. Detto questo, Netflix alla fine ha abbandonato il perseguimento di MSE e non sono stati assegnati altri premi Netflix
E questo è il punto: ridurre al minimo l'errore predittivo può essere facilmente giocato o p-hackerato ed è incline alla frode dell'analista (vale a dire, trovare una soluzione che esalta le capacità di modellazione dell'analista, incidendo positivamente sul suo potenziale bonus di fine anno). Inoltre, è una soluzione e un obiettivo completamente statistici stabiliti in un vuoto economico e commerciale. La metrica fornisce poca o nessuna considerazione dei costi collaterali e accessori - le reali conseguenze operative valutate dalla A alla Z che dovrebbero essere parte integrante di qualsiasi processo decisionale a pieno carico e basato su trade-off.
Questo è diventato uno di quei problemi che è incorporato nelle organizzazioni ed è molto, molto difficile da cambiare. In altre parole, sono pienamente consapevole del fatto che mi sto inclinando verso i mulini a vento con questo rantolo delle avvertenze con l'uso della PA.