Taleb e il cigno nero


63

Il libro di Taleb "The Black Swan" è stato un best seller del New York Times quando è uscito diversi anni fa. Il libro è ora alla sua seconda edizione. Dopo l'incontro con gli statistici a un JSM (una conferenza statistica annuale), Taleb ha attenuato in qualche modo la sua critica alle statistiche. Ma il fulcro del libro è che le statistiche non sono molto utili perché si basano sulla distribuzione normale e su eventi molto rari: i "Cigni neri" non hanno distribuzioni normali.

Pensi che questa sia una critica valida? Taleb manca di alcuni aspetti importanti della modellistica statistica? È possibile prevedere eventi rari almeno nel senso che è possibile stimare le probabilità di accadimenti?



2
Anche IMO non credo che un tag "cigni neri" sarà molto utile. Una specie di gergo interno a questo particolare autore che dovrebbe essere evitato dall'IMO. Gli eventi rari mi sembrano sufficienti, ma sapresti sicuramente il gergo meglio di me.
Andy W,

1
@AndyW Mentre i cigni neri possono essere un termine coniato da Taleb, sta diventando un termine comunemente usato per eventi rari e quindi potrebbe riguardare in modo più ampio del semplice libro di Taleb.
Michael Chernick,

2
Non ho necessariamente un problema con la creazione di un tag "cigni neri" o di un tag "eventi rari", tuttavia, incoraggio vivamente le persone a creare almeno un estratto wiki tag durante la creazione di un nuovo tag. I futuri utenti avranno bisogno di una guida per quanto riguarda il significato e l'uso corretto del tag. Potrebbe anche essere utile creare entrambi e rendere immediatamente bs un sinonimo di re, per evitare di imbattersi in questo problema accidentalmente in futuro.
gung - Ripristina Monica

2
A proposito di @kjetilbhalvorsen ho letto il libro sulle finanze di Benoit Mandelbrot e non sono riuscito a superare il fatto che praticamente tutte le idee di The Black Swan sono lì, molto meglio spiegate, e senza discontinuità. Ha davvero illuminato una luce diversa sul "contributo" di Taleb.
Antoni Parellada,

Risposte:


69

Ho letto il cigno nero un paio d'anni fa. L'idea del cigno nero è buona e l'attacco all'errore ludico (vedere le cose come se fossero giochi di dadi, con probabilità conoscibili) è buono ma le statistiche sono scandalosamente travisate, con il problema centrale che è l'affermazione sbagliata che tutte le statistiche cadono a pezzi se le variabili non sono normalmente distribuiti. Ero abbastanza infastidito da questo aspetto per scrivere a Taleb la lettera seguente:

Caro dottor Taleb

Di recente ho letto "Il cigno nero". Come te, sono un fan di Karl Popper e mi sono trovato d'accordo con molto di ciò che c'è dentro. Penso che la tua esposizione all'errore ludico sia fondamentalmente sana e attiri l'attenzione su un problema reale e comune. Tuttavia, penso che gran parte della Parte III delinei il tuo argomento generale, fino al punto di screditare il resto del libro. Questo è un peccato, poiché ritengo che gli argomenti relativi ai cigni neri e alle "incognite sconosciute" siano meriti senza fare affidamento su alcuni degli errori nella parte III.

La questione principale che desidero sottolineare - e su cui cerco la tua risposta, in particolare se ho frainteso i problemi - è la tua falsa rappresentazione del campo delle statistiche applicate. A mio giudizio, i capitoli 14, 15 e 16 dipendono in gran parte da un argomento di paglia, che travisa statistiche ed econometria. Il campo di econometria che descrivi non è quello che mi è stato insegnato quando ho studiato statistica applicata, econometria e teoria del rischio attuariale (presso la Australian National University, ma usando testi che sembravano piuttosto standard). I problemi che sollevi (come i limiti delle distribuzioni gaussiane) sono ben compresi e veramente compresi e insegnati, anche a livello universitario.

Ad esempio, fai di tutto per mostrare come la distribuzione del reddito non segue una distribuzione normale e la presenti come argomento contro la pratica statistica in generale. Nessuno statistico competente affermerebbe mai che lo fa, e i modi per affrontare questo problema sono ben definiti. Il solo uso di tecniche del livello più elementare di "econometria del primo anno", ad esempio, trasformando la variabile prendendo il suo logaritmo renderebbe i tuoi esempi numerici molto meno convincenti. Una tale trasformazione, infatti, invaliderebbe molto di ciò che dici, perché allora la varianza della variabile originale aumenta all'aumentare della sua media.

Sono sicuro che ci sono alcuni econometrici incompetenti che fanno regressioni OLS ecc. Con una variabile di risposta non trasformata come dici tu, ma ciò li rende semplicemente incompetenti e usa tecniche che sono ben stabilite per essere inadeguate. Sarebbero certamente falliti anche nei corsi di laurea, che trascorrono molto tempo alla ricerca di modi più appropriati di modellare variabili come il reddito, riflettendo la distribuzione effettiva osservata (non gaussiana).

La famiglia di modelli lineari generalizzati è un insieme di tecniche sviluppate in parte per aggirare i problemi che sollevi. Molte delle famiglie esponenziali di distribuzioni (ad es. Distribuzioni Gamma, esponenziali e Poisson) sono asimmetriche e hanno una varianza che aumenta all'aumentare del centro della distribuzione, aggirando il problema che si evidenzia con l'utilizzo della distribuzione gaussiana. Se questo è ancora troppo limitante, è possibile eliminare del tutto una "forma" preesistente e semplicemente specificare una relazione tra la media di una distribuzione e la sua varianza (ad esempio, consentendo alla varianza di aumentare proporzionalmente al quadrato della media), utilizzando il metodo di stima "quasi-verosimiglianza".

Certo, potresti sostenere che questa forma di modellistica è ancora troppo semplicistica e una trappola intellettuale che ci induce a pensare che il futuro sarà come il passato. Potresti avere ragione e penso che la forza del tuo libro sia quella di far sì che persone come me lo considerino. Ma hai bisogno di argomenti diversi da quelli che usi nei capitoli 14-16. Il grande peso che attribuisci al fatto che la varianza della distribuzione gaussiana è costante indipendentemente dalla sua media (che causa problemi di scalabilità), ad esempio, non è valida. Quindi è la tua enfasi sul fatto che le distribuzioni della vita reale tendono ad essere asimmetriche piuttosto che curve a campana.

Fondamentalmente, hai adottato una semplificazione eccessiva dell'approccio più elementare alla statistica (modellistica ingenua di variabili grezze come avere distribuzioni gaussiane) e mostrato, a grandi linee, (correttamente) le carenze di un approccio così semplificato. Quindi lo usi per creare il divario per screditare l'intero campo. Questo è un grave errore logico o una tecnica di propaganda. È sfortunato perché sminuisce il tuo argomento generale, gran parte del quale (come ho detto) ho trovato valido e convincente.

Sarei interessato a sentire quello che dici in risposta. Dubito di essere il primo ad aver sollevato questo problema.

cordiali saluti

PE


24
Hai ricevuto una risposta?
cardinale il

4
Sì. Molti statistici hanno già criticato la distribuzione normale prima! Solo un esempio: il famoso statistico danese Georg Rasch (noto per i modelli di Rasch in psicometria!) Era noto per dire, quando aveva bevuto troppo, che "tutti i libri che menzionano la distribuzione normale dovrebbero essere bruciati"!
kjetil b halvorsen,

5
++ Peter. Un'ottima lettera !!
Michael Chernick,

14
@cardinal - Ho ricevuto una risposta automatica all'effetto di "dalla crisi finanziaria globale ho ricevuto troppe e-mail per rispondere".
Peter Ellis,

4
Sembra che la quantità di e-mail in risposta al libro sia stata una BlackSwan. :)
scritto il

22

Non ho letto il libro, ma come detto la critica mi sembra abbastanza irragionevole. Se gli eventi estremi sono importanti, la statistica ha strumenti adeguati nella cassetta degli attrezzi, come la teoria dei valori estremi, e un buon statistico saprà come usarli (o almeno scoprirà come usarli e sarà sufficientemente coinvolto con lo scopo di l'analisi da guardare). La critica sembra essere "le statistiche sono cattive perché ci sono cattivi statistici che conoscono solo le normali distribuzioni".


4
Magari leggi il libro prima di criticarlo?
kjetil b halvorsen,

7
@kjetilbhalvorsen Non sto criticando il libro, sto criticando le critiche come indicato nella domanda (che può essere o meno una rappresentazione adeguata del contenuto del libro). L'ho reso molto chiaro dal testo della mia risposta (nota che ho usato la parola "libro" solo una volta, per dare l'avvertenza che non avevo letto, e non ho menzionato affatto Talb per nome). Forse leggi attentamente la risposta prima di criticarla? ; o)
Dikran Marsupial,

19

Dire che "la spinta del libro è che la statistica non è molto utile" è inesatto, penso. Dopo aver letto il libro, ciò che sembra dire è che cose come la finanza quantitativa o qualsiasi tipo di negoziazione di titoli che presume una distribuzione normale sia fondamentalmente difettosa (in realtà, nel libro, chiama le persone che affermano di utilizzare questi modelli per fare previsioni , "ciarlatani"). Secondo Taleb, mentre la distribuzione normale fa un ottimo lavoro nel modellare i valori di cose tangibili / fisiche (ad es. Altezza, peso, durata della vita ecc.), Sistemi come i mercati sono spesso guidati dall'emozione umana e quindi sono inclini a grandi oscillazioni che le normali distribuzioni non possono prevedere con precisione.

Non capisco bene le statistiche e fino a quando non ho letto le risposte qui, non avevo mai sentito parlare di cose come la teoria del valore estremo. Indipendentemente da ciò, The Black Swan e Fooled By Randomness sembrano avere premesse simili, che è "la distribuzione normale non è sempre OK". Non ricordo che diffamasse l'intero campo delle statistiche.


16
(+1) Per la prima frase. Tuttavia, Taleb è più un polemista (egocentrico) che un intellettuale serio. Ho solo la prima edizione di BS; il suo commento sulla statistica è sopravvalutato e disinformato in molti punti, ma la tentata tesi del testo è più di quanto citato nella prima frase, come fai notare.
cardinale il

3
+1 Penso che la chiave sia quando si parla di finanza. Un link sul New York Times che cita dal primo capitolo, credo: nytimes.com/2007/04/22/books/chapters/0422-1st-tale.html
Wayne

6
I prezzi delle opzioni, ad esempio, sono iniziati con le normali ipotesi sui rendimenti dei registri, ma sanno che molti giorni rappresentano la curtosi con modelli di volatilità / diffusione stocastica più complessi.
muratoa,

4
+1 Benvenuto nel nostro sito! Grazie mille per aver condiviso i tuoi pensieri.
whuber

4
Dopo aver letto il libro e scritto la mia critica (potrei avere una recensione di Amazon Custoner su di esso insieme a migliaia di altri), penso che Taleb abbia la finanza e il mercato azionario come suoi primi esempi, ma ha una visione più generale del chiamato Black Swans e ha una visione molto disinformata delle statistiche e della professione statistica (almeno nella prima edizione). L'uso improprio della distribuzione normale può essere una valida critica per il modo in cui alcuni individui possono modellare eventi rari. Ma molti di noi lo fanno nel modo giusto e c'è un valore nei risultati dall'approccio corretto.
Michael Chernick,

18

Ho letto "Il cigno nero", mi è piaciuto e sono uno statistico. Non ho trovato insopportabile la sua "critica della statistica". Punto per punto:

  1. Taleb non ha inventato il concetto di cigno nero. Era stato un esempio favorito nel pensiero filosofico per un bel po '!
  2. Taleb non critica tanto le "statistiche", quanto certe (cattive) applicazioni.
  3. Il libro è stato un bestseller. Non era diretto verso gli statistici, ma al grande pubblico. Ha fatto molto bene a insegnare al pubblico cose che gli statistici sapevano molto bene, ma molti altri lettori (la maggioranza!) Non lo sapevano. Quindi abbiamo potuto imparare molto da quel libro su come "vendere" le statistiche.
  4. Più importante (per me), Taleb includeva molti riferimenti all'antica filosofia scettica greca. Nessun altro ha menzionato questo punto qui, ma penso che l'inclusione sia stata il vero punto di forza del libro!
  5. Il libro è un'opera letteraria, non un'opera tecnica. Se vuoi criticare Taleb per il suo lavoro tecnico, vai alla sua homepage e scarica alcuni dei suoi articoli tecnici.

Per coloro a cui non piace questa risposta, o che non amano il libro, possono dare un'occhiata agli argomenti tecnici di Taleb nel nuovo https://fernandonogueiracosta.files.wordpress.com/2014/07/07/taleb-nassim-silent-risk. pdf "Rischio silenzioso", che è tecnico.


6
Un grande +1 per essere il primo (oops - secondo) rispondente effettivamente qualificato a parlare del libro! (E per aver detto anche alcune cose interessanti al riguardo.)
whuber

4
che dire della sua rappresentazione di econometria e statistica come dipendente dalle distribuzioni gaussiane?
Peter Ellis,

2
@kjetilbhalvorsen Dici di aver letto il libro. Se lo leggi attentamente non è possibile perdere l'allegato sulla professione statistica. Avere una laurea in matematica non significa nulla per quanto riguarda la conoscenza delle statistiche delle persone. Molti matematici hanno ottenuto la laurea senza seguire un solo corso di statistica. Altri potrebbero aver avuto solo un corso molto elementare. Conosco matematici che hanno insegnato statistica e / o probabilità e non sono stati abilitati a farlo.
Michael Chernick,

3
Michael Chernik: Potrebbe essere così, ma continuo a criticare un'opera per i suoi punti di forza, almeno non solo per i suoi punti deboli! e un'opera letteraria deve essere letta come tale. Taleb dovrebbe essere gratificato per aver trasformato i cigni neri in un concetto che molte persone capiscono. È un concetto importante. Lo dimostrano tutti i giornalisti che ridicolizzano Rumsfeldt per aver parlato di "incognite sconosciute". Rumsfeldt stava usando solo un concetto appreso dagli ufficiali militari! Almeno sapevano dei cigni neri.
kjetil b halvorsen,

9
"Un'opera letteraria" è solo una scusa per travisare la realtà se ciò che Taleb ha scritto fosse un romanzo. Non andare in un trattamento tecnico è scusabile, travisare qualcosa all'ingrosso è meno.
Fomite,

10

Non ho letto il cigno nero, ma se la sua critica delle statistiche è davvero semplice come dici tu, allora è ridicola. Ovviamente alcune statistiche si basano sulla distribuzione normale, ma molto no.

È possibile modellare eventi rari? Certo che possono. La vera domanda è quanto bene possano essere modellati. E quella domanda avrà risposte diverse in diversi campi, in base a quanto sappiamo degli eventi rari e dei loro antecedenti.

Nel NY Times Magazine di oggi c'è un interessante articolo di Nate Silver su come le previsioni del tempo sono migliorate negli ultimi dieci anni circa. Ciò include una migliore modellizzazione di eventi rari come gli uragani.

Vale la pena leggere il libro?


3
Ho letto il libro e ho creato controargomentazioni simili come le vostre e quelle di Dikran. Taleb sembrava molto ingenuo. C'è stata una sessione che lo ha coinvolto al JSM alcuni anni fa. Penso che fosse a Washington. La seconda edizione è uscita dopo ed è un po 'più ragionevole. Taleb ha alcune cose interessanti da dire su specifici "cigni neri" e sa molto di economia. Penso che valga la pena leggere e la seconda edizione è migliore.
Michael Chernick,

Sei un amministratore di un sito di statistiche, quindi probabilmente la parte 3 non ti interesserà. Potrebbe persino irritarti. Le parti I e II potrebbero darti un'idea al di fuori delle statistiche. Puoi provare a leggere il primo capitolo o giù di lì e poi giudicare il resto del libro da lì. Per quanto riguarda il tempo, Taleb sembra implicare che i meteorologi sono esperti che tendono ad essere esperti: esperti che tendono ad essere esperti: giudici del bestiame, astronomi, test piloti, giudici del suolo, maestri di scacchi, fisici, matematici (quando affrontano problemi matematici , non empirici), commercialisti, ispettori del grano, ph
BCLC

ispettori del grano, interpreti di foto, analisti assicurativi (si occupano di statistiche di tipo a campana curva) Esperti che tendono ad essere ... non esperti: agenti di cambio, psicologi clinici, psichiatri, ufficiali di ammissione al college, giudici di tribunale, consiglieri, selezionatori di personale, analisti dell'intelligence (il record della CIA, nonostante i suoi costi, è pietoso), a meno che non si tenga conto di una grande dose di prevenzione invisibile. Aggiungerei questi risultati dal mio esame della letteratura: economisti, meteorologi, professori di finanza, scienziati politici, "esperto di rischio
BCLC,

s, "personale della Banca dei regolamenti internazionali, agosto membri dell'Associazione internazionale degli ingegneri finanziari e consulenti finanziari personali. Semplicemente, le cose che si muovono, e quindi richiedono conoscenza, di solito non hanno esperti, mentre le cose che non si muovono sembrano avere degli esperti. In altre parole, le professioni che si occupano del futuro e basano i loro studi sul passato non ripetibile hanno un problema di esperti (ad eccezione del tempo e delle imprese che coinvolgono processi fisici a breve termine, non quelli socioeconomici).
BCLC,

1
SÌ, vale la pena leggere il libro!
kjetil b halvorsen,

8

Anche io non ho letto il libro, ma non c'è modo che il suo punto possa essere semplicistico come dire che ci sono distribuzioni con code più grosse della normale distribuzione. Questo sarebbe un commento alle altre risposte, ma non ho accumulato abbastanza riconoscimenti su questo sito web.

Da Wikipedia:

"Afferma che la statistica è fondamentalmente incompleta come campo in quanto non può prevedere il rischio di eventi rari ..."

Questa domanda è anche abbastanza simile a Qual è l'opinione della comunità sul Quarto quadrante?


2
Non ero a conoscenza del post su "Quarto quadrante". Lì John Cook indica JSM in cui Taleb ha parlato e fornisce un collegamento ai commenti del suo blog sul discorso. Il post è quasi un duplicato del mio, ma la discussione è breve lì. Quindi penso che valga la pena continuare questo.
Michael Chernick,

2
Non credo sia vero che le statistiche non possano prevedere il rischio di eventi rari. È difficile perché generalmente non ci sono molte informazioni utili per questa attività nei dati nello stesso modo in cui esistono per stimare la tendenza centrale. Quindi non è un problema tanto con le statistiche quanto con i dati.
Dikran Marsupial,

2
@dikran: sono d'accordo con te e penso che i suoi libri siano libri di troll. Ma perderei ancora orribilmente in un dibattito contro di lui, allo stesso modo in cui perderei contro un esperto dibattitore di design intelligente.
bozza del

1
@draft sì, c'è una buona ragione per cui le idee scientifiche non sono più risolte dal dibattito pubblico!
Dikran Marsupial,

4
C'è di più nel libro oltre alla questione degli statisitchi - le sue argomentazioni su "sconosciuti sconosciuti" (i cosiddetti cigni neri) e sulla "fallacia ludica" (trattando il mondo come se fosse un gioco di dadi con probabilità knwon) sono praticamente indipendente dalla sua critica sbagliata delle statistiche come dipendente dalle normali distribuzioni. Puoi eliminare tutti i capitoli delle statistiche e migliorare notevolmente il libro.
Peter Ellis,


5

Non credo che Taleb direbbe effettivamente che le tecniche statistiche basate sulla distribuzione gaussiana non siano utili. Il suo punto nel libro era che sono molto utili per molti (ma non tutti) processi e modelli fisici o biologici. Fa alcuni punti positivi e altri cattivi (The Black Swan e Linked sono stati l'inizio della pestilenza "tutto è una legge di potere!" Che ci perseguita ancora oggi), ma è importante ricordare che il libro è una raccolta di opere letterarie e filosofiche saggi pensati per il laico.

Detto questo, penso che a Taleb piaccia aggravare le persone. Puoi vederlo nella sua battaglia con Myron Scholes. In questo caso potrebbe essere stato utile come educazione statistica a livello universitario, e talvolta a livello universitario, una sorta di schivata sull'ipotesi di distribuzioni gaussiane. Immagino che durante i suoi anni in finanza abbia incontrato un gran numero di domande con una grande conoscenza di Black-Scholes e di altre tecniche, ma che non hanno preso in considerazione ipotesi di fondo come la distribuzione. Ho il sospetto che Taleb stia frugando nell'istituto scolastico per non aver educato adeguatamente.


1
+1 per i tuoi commenti interessanti. Ma non sono d'accordo sulla sua visione della distribuzione normale. Sembra pensare che gli statistici lo usino dove non si applica e ha torto a caratterizzare gli statistici in quel modo. Potrebbe sapere meglio ora. Sì, ha chiaramente uno stile di scrittura che ha lo scopo di provocare e irritare le persone.
Michael Chernick,

1
Non ho il libro con me lo so, quindi questo è a memoria. Sicuramente parte della sua rabbia proviene da una brutta esperienza con le persone. Dice che a un certo punto "qualcuno" (pubblicherà quando avrò il libro e troverò i nomi) gli urlò "Sono un membro dell'Accademia nazionale delle scienze"! Questo non è esattamente un argomento, e "qualcuno" doveva essere deriso per usarlo come tale.
kjetil b halvorsen,

2
È possibile che io abbia dato una svolta inconscia a ciò che stavo leggendo, ma ho chiaramente ricordato NTT facendo diversi esempi in cui la distribuzione gaussiana aveva un senso, come la sua tazza di caffè. Ho regalato il libro, quindi non posso tornare indietro e rivalutarlo. La popolare scrittura di Taleb è molto più polemica della sua scrittura professionale, almeno quello che ho letto di quest'ultimo.
Fraijo,

2
Non penso che stiamo sostenendo che Taleb pensa che la distribuzione normale non abbia mai senso. È solo che per gli esempi che ritiene importanti ritiene che sia improprio usarlo. Ha ragione, ma ha torto nel pensare che la maggior parte degli statistici lo usi in quelle situazioni.
Michael Chernick,

1
Interessante non solo quanti commentatori non hanno letto il libro (io, per esempio, l'ho sfogliato e questo era un sacco), ma quanti l'hanno letto, ma non ho ritenuto opportuno tenerlo a portata di mano. "L'ho dato via"; "L'ho lasciato in soffitta"; ecc.
rolando2 il

2

Quelli di voi che non hanno letto il libro sono lontani dalla base. Fa una GRANDE distinzione tra scalabile e non scalabile. Per questioni non scalabili, le statistiche tradizionali serviranno abbastanza bene. Non lo sta criticando in alcun modo. I cigni neri hanno origine in scala e sono difficili da prevedere dati empirici passati. Il libro parla di come questi eventi possono avere un impatto enorme e generalmente vengono spiegati solo dopo il fatto. L'epistemologia è eccellente.


-2

Senza leggere il libro sento che le campane gaussiane falliscono perché non hanno mai dato una chiara definizione di "densità di probabilità"; oltre a ciò, non forniscono mai un set completo di punti delle curve di Lorenz che includono allo stesso tempo il totale della variabile distribuita e il totale delle popolazioni che percepiscono la prima. Se si usa "densità" è necessario spiegare in merito a quale variabile; ad esempio se parli di chilogrammi per litro si riferisce a una densità di peso correlata al volume. Questo passo non è dato dalla teoria gaussiana nei libri di testo. Nessuna meraviglia che i giovani non capiscano correttamente le statistiche.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.