È sbagliato riformulare "1 decesso su 80 è causato da un incidente d'auto" poiché "1 persona su 80 muore a causa di un incidente d'auto?"


56
  • Dichiarazione 1 (S1): "Una morte su 80 è causata da un incidente d'auto".
  • Dichiarazione due (S2): "Una persona su 80 muore a causa di un incidente d'auto".

Ora, personalmente non vedo molta differenza tra queste due affermazioni. Quando scrivo, li considererei intercambiabili con un pubblico laico. Tuttavia, ora sono stato sfidato da due persone e sto cercando una prospettiva aggiuntiva.

La mia interpretazione predefinita di S2 è "Di 80 persone disegnate in modo uniforme a caso dalla popolazione umana, ci aspetteremmo che uno di loro muoia a causa di un incidente d'auto" - e considero questa affermazione qualificata equivalente a S1.

Le mie domande sono le seguenti:

  • Q1) La mia interpretazione predefinita è effettivamente equivalente all'istruzione One?

  • Q2) È insolito o sconsiderato che questa sia la mia interpretazione predefinita?

  • D3) Se ritieni che S1 e S2 siano diversi, in modo tale da indicare il secondo quando uno indica che il primo è fuorviante / errato, potresti fornire una revisione completa di S2 equivalente?

Mettiamo da parte l'evidente cavillo che S1 non si riferisce specificamente alle morti umane e ipotizziamo che ciò sia compreso nel contesto. Mettiamo da parte anche qualsiasi discussione sulla veridicità della pretesa stessa: si intende che sia illustrativa.

Come meglio posso dire, i disaccordi che ho ascoltato finora sembrano incentrati sull'insolvenza di interpretazioni diverse della prima e della seconda affermazione.

Per la prima volta, i miei sfidanti sembrano interpretarlo come 1/80 * num_deaths = numero di morti causate da incidenti stradali, ma per qualche ragione, per impostazione predefinita, una diversa interpretazione della seconda sulla falsariga di "secondo te" di 80 persone, uno di loro sarà morire in un incidente d'auto"(che ovviamente non è un reclamo equivalente). Penso che, data la loro interpretazione di S1, il loro valore predefinito per S2 sarebbe leggerlo come (1/80 * num_dead_people = numero di persone che sono morte in un incidente d'auto == numero di decessi causati da incidente d'auto). Non sono sicuro del motivo per cui la discrepanza nell'interpretazione (il loro valore predefinito per S2 è un presupposto molto più forte) o se hanno un innato senso statistico che in realtà mi manca.


19
"se hai una serie di 80 persone, una di loro morirà in un incidente d'auto" - se è così che capiscono questa affermazione, allora ho una battuta estremamente vecchia sul fatto che 1 bambino su 3 è cinese che sono assolutamente intenzione di amore .
Steve Jessop,

3
Questo è molto simile alla differenza tra prevalenza e incidenza . Come altri hanno notato che "è causato" si riferisce ad uno stato finito, e "muore" si riferisce al presente o al futuro.
Sesto Empirico

5
S2 non chiarisce che l'altro 79 è morto. Alcuni o tutti gli altri 79 potrebbero essere vivi. S1 dice "1 decesso su 80" il che chiarisce che tutti gli 80 nel gruppo sono morti.
Michael Chernick il

5
Come laico, senza conoscere il contesto, interpreterei S1 come: "su tutte le cause di morte per la popolazione X, 1/80 è dovuto a incidenti stradali", mentre S2 mi dice: "su tutte le persone coinvolte in incidenti stradali, 1 su 80 muore a causa di questo ".
Gnudiff il

5
(S2): "Una persona su 80 muore a causa di un incidente d'auto." mi sembra ambiguo. È una persona su 80 che ha avuto incidenti stradali o una su 80 persone?
Bill the Lizard,

Risposte:


67

Innanzitutto, il mio primo pensiero intuitivo è stato: "S2 può essere lo stesso di S1 ​​se il tasso di mortalità per traffico rimane costante, forse per decenni", che certamente non sarebbe stato un buon presupposto negli ultimi decenni. Ciò suggerisce già che una difficoltà sta nelle ipotesi temporali implicite / non dette.

Direi che le tue dichiarazioni hanno il modulo

1 in x population experience event .

In S1, la popolazione è deceduta e le specifiche temporali implicite sono attualmente o "in un intervallo sufficientemente ampio [per avere un numero sufficiente di casi] ma non troppo ampio [per avere caratteristiche di incidente d'auto approssimativamente costanti] attorno al presente"

In S2, la popolazione è gente. E altri sembrano leggerlo non come "persone morenti" ma come "persone viventi" (che, dopo tutto, è ciò che le persone più frequentemente / più fanno). Se leggi la popolazione come gente viva, chiaramente, non una su 80 persone che vivono ora muore "adesso" per un incidente d'auto. In modo che si legge come "quando stanno morendo [forse decenni da oggi], la causa della morte è un incidente d'auto".

Porta a casa il messaggio: fai sempre attenzione a precisare chi sono la tua popolazione e il denominatore delle frazioni in generale. (Gerd Gigerenzer ha scritto articoli su non precisare che il denominatore è una delle principali cause di confusione, in particolare nelle statistiche e nella comunicazione del rischio).


1
"In S1, la popolazione è deceduta e la specifica temporale implicita è attualmente o" in un intervallo sufficientemente ampio [per avere un numero sufficiente di casi] ma non troppo ampio [per avere caratteristiche di incidente d'auto approssimativamente costanti] intorno al presente "- Considerando tutte le (meravigliose) risposte che ho ricevuto, penso che ciò influisca maggiormente sul nocciolo della questione. Sono stato doppiamente sorpreso dall'enorme varietà di modi in cui le persone possono fare la seconda affermazione, e molti hanno aperto la mia occhi a quelle interpretazioni, ma io questa è la specifica statistica mancava alla mia affermazione originale.
faulty_ram_sticks

faulty_ram_sticks: Grazie per i fiori :-) E queste due possibili specifiche di popolazione che ho fatto da S2 non sono di gran lunga le uniche, ad esempio potresti specificare sulla falsariga della risposta di @ PeterShor una popolazione di persone nate in un determinato arco di tempo e seguire quella uno (longitudinalmente). E così via.
cbeleites supporta Monica il

@cbeleites flowers? che fiori? : - /
The Great Duck

1
Potrei anche sottolineare che l'uso di "decessi è causato" e che "persone muoiono " è anche una formulazione confusa / cattiva. Mi sento di descrivere una statistica che dovrebbe essere "decessi causati" e "persone decedute". Ciò rende inequivocabile che stai descrivendo un evento passato piuttosto che fare una previsione. Naturalmente si potrebbe anche dire che "la gente morirà" per dire che la statistica fornisce credito per una previsione che una certa percentuale della popolazione attuale morirà a causa di incidenti stradali. Fornisco questi esempi qui per riferimento futuro in quanto non sono una risposta a sé stante.
The Great Duck

Ma dire che una percentuale di morti è causata mi confonde perché ciò descrive il presente come se l'evento stesse accadendo proprio ora o qualcosa del genere. Se lo vedessi, lo considererei povero, ma probabilmente non leggerei molto. Tuttavia, poiché si tratta di una discussione sulla formulazione, ho sentito che avrei dovuto parlarne.
The Great Duck

80

Per me "1 su 80 morti ..." è di gran lunga la frase più chiara. Il denominatore nel tuo "1 su 80" è l'insieme di tutti gli eventi di morte e questa affermazione lo rende esplicito.

C'è un'ambiguità nella formulazione "1 su 80 persone ...". Intendi davvero "1 persona su 80 che muore ..." ma l'affermazione può essere facilmente interpretata come "1 persona su 80 ora viva ..." o simile.

Sono tutto per essere esplicito sull'insieme di riferimento in asserzioni di probabilità o frequenza come questa. Se stai parlando della percentuale di morti, allora dì "morti" e non "persone".


31
"" 1 persona su 80 che muore ... "- dato che non esiste l'immortalità, possiamo tranquillamente presumere che l'insieme di persone che moriranno è lo stesso di tutte le persone. Avresti bisogno di un qualificatore aggiuntivo, ad es. "persone che moriranno l'anno prossimo "
MSalters il

16
@Msalters Le dichiarazioni sono al tempo presente, quindi fanno valere un reclamo sul tasso attuale.
Accumulo il

6
Tecnicamente, penso che "1 persona su 80" sia più specifica, perché ci sono molte più morti rispetto alla morte delle persone: morte di uccelli, morte di batteri, morte di pedanteria, ...
Kimball

2
@Pere: non so proprio, segui, stai dicendo la stessa cosa da quando ho detto the 1/80 ratio does focus on the present time in particular. O sto fraintendendo?
Flater

3
(Sulla nota della possibile ambiguità) Dal punto di vista della lingua inglese; Penso che un malinteso più comune (e più grave) sarebbe leggere S2 per dire "1 persona su 80 che ha un incidente d'auto, morirà in quell'incidente" (cioè "1 incidente d'auto su 80 è fatale") - che è un'affermazione molto diversa.
Bilkokuya,

43

Dipende se stai descrivendo o predicendo .

"Una persona su 80 morirà in un incidente d'auto" è una previsione. Di tutte le persone viventi oggi, qualche tempo nella loro vita rimanente, uno su 80 morirà in quel modo.

"1 decesso su 80 è causato da un incidente d'auto" è una descrizione. Di tutte le persone che sono morte in un determinato periodo (ad es. L'intervallo di tempo di uno studio di supporto), 1 su 80 di loro è morto in un incidente d'auto.

Si noti che la finestra temporale qui è ambigua. Una frase implica che le morti sono già avvenute; l'altro implica che accadranno un giorno. Una frase implica che la popolazione di base è costituita dalle persone che sono morte (e che erano ancora in vita prima); l'altro implica una popolazione di base di persone che sono vive oggi (e moriranno alla fine).

Queste sono in realtà dichiarazioni completamente diverse e solo una di esse è probabilmente supportata dai dati di origine.

Da un lato, l'ambiguità deriva da una discrepanza tra lo stato di essere una persona (che accade continuamente) e l' evento di morte (che accade in un determinato momento). Ogni volta che unisci le cose in questo modo ottieni qualcosa di altrettanto ambiguo. È possibile risolvere all'istante l'ambiguità utilizzando due eventi anziché uno stato e un evento; per esempio "Di ogni 80 persone nate, 1 muore in un incidente d'auto".


1
Oltre ad essere una previsione, potrebbe essere bizzarramente interpretata come una minaccia. Leggere questa risposta mi ha fatto pensare al pertinente xkcd .
Wildcard il

3
"Oggi, un decesso su 80 è causato da un incidente d'auto. Ma dato il rapido miglioramento della tecnologia dei veicoli e della strada e il passaggio graduale ad altri modi di trasporto, prevediamo che questo scenderà a uno su 120 entro il 2050, e uno su 150 entro il 2100. Di conseguenza, delle persone vive oggi, solo uno su 135 morirà in un incidente d'auto ".
Michael Kay il

21

Le due affermazioni sono diverse a causa della propensione al campionamento, poiché è più probabile che si verifichino incidenti automobilistici quando le persone sono giovani.

Rendiamolo più concreto proponendo uno scenario non realistico.

Considera le due affermazioni:

  • La metà di tutti i decessi è causata da un incidente d'auto.
  • La metà di tutte le persone vive oggi morirà in un incidente d'auto.

Mostreremo che queste due affermazioni non sono uguali.

Semplificiamo notevolmente le cose e supponiamo che tutti i nati moriranno di infarto all'età di 80 anni o di un incidente d'auto all'età di 40 anni. Supponiamo inoltre che la prima affermazione sopra sia valida e che siamo in una popolazione statale stabile, quindi le morti bilanciano le nascite. Quindi ci saranno tre popolazioni di umani, tutte ugualmente grandi.

  • Le persone sotto i 40 anni che moriranno per un incidente d'auto.
  • Le persone sotto i 40 anni che moriranno di infarto.
  • Le persone sopra i 40 anni che moriranno di infarto.

Queste tre popolazioni devono essere ugualmente grandi, perché il tasso di decesso negli incidenti automobilistici (dalla prima popolazione in alto) e il tasso di decesso negli infarti (dalla terza popolazione in alto) sono uguali.

1/401/40

Quindi, in questo caso, solo un terzo di tutte le persone in vita oggi morirà in un incidente d'auto, quindi le due affermazioni non sono le stesse.

Nella vita reale, la mia impressione è che gli incidenti stradali si verificano in età significativamente più giovane rispetto alla maggior parte delle altre cause di morte. Se questo è il caso, ci sarà una differenza sostanziale tra i numeri nell'istruzione uno e due.

Se hai modificato la seconda istruzione in

  • La metà di tutte le persone nate morirà in un incidente d'auto,

quindi sotto il presupposto di una popolazione statale stabile, le due dichiarazioni sarebbero equivalenti. Ma ovviamente, nel mondo reale non abbiamo una popolazione statale stabile, e un argomento simile (anche se più complicato) mostra che per una popolazione crescente o in diminuzione, il pregiudizio del campionamento rende ancora queste due affermazioni diverse.


"Queste tre popolazioni devono essere ugualmente grandi, perché il tasso di persone che muoiono in attacchi di cuore (dalla prima popolazione sopra) e il tasso di persone che muoiono in attacchi di cuore (dalla terza popolazione sopra) sono uguali". Pensi di poterlo rendere un po 'più ovvio? (Suppongo anche che intendi incidenti stradali per la prima popolazione) Altrimenti, questo è un ottimo esempio. Non avevo nemmeno considerato che ci potesse essere una differenza tra "La metà di tutte le persone nate" e "La metà di tutte le persone vive".
faulty_ram_sticks il

@faulty_ram_sticks. Sì: il bias di campionamento può essere complicato. L'ho spiegato in modo più dettagliato ... Spero che ora sia abbastanza buono. E grazie per avermi colto in errore.
Peter Shor,

5
Questa è una meravigliosa domanda di bias sul campionamento. Il fatto che le prime 8 risposte non abbiano colto il pregiudizio del campionamento dimostra che questo è davvero complicato. Potrei usarlo quando insegno probabilità.
Peter Shor,

Argomento molto ben costruito, chiaro e quello che non solo teoricamente invalida l'intuizione dell'OP di equivalenza in un modo a cui probabilmente non ha nemmeno pensato.
Peter - Ripristina Monica il

12

La mia interpretazione predefinita è effettivamente equivalente alla prima affermazione?

No.

Diciamo che abbiamo 800 persone. 400 sono morti: 5 da un incidente d'auto, gli altri 395 hanno dimenticato di respirare. S1 è ora vero: 5/400 = 1/80. S2 è falso: 5/800! = 1/80.

Il problema è che tecnicamente S2 è ambiguo perché non specifica quanti decessi ci sono stati in totale, mentre S1 lo fa. In alternativa, S1 ha un'informazione in più (morti totali) e un'informazione in meno (persone totali). Preso al valore nominale, descrivono rapporti diversi.

È insolita o sconsiderata che questa sia la mia interpretazione predefinita?

In realtà non sono d'accordo con la tua interpretazione, ma penso che non abbia importanza. Probabilmente, il contesto renderebbe ovvio cosa si intende.

  • Da un lato, ovviamente tutte le persone muoiono, quindi è implicito che le persone totali = decessi totali. Quindi, se stai discutendo i tassi di mortalità in generale, si applica la tua interpretazione predefinita.
  • Dall'altro, se stai discutendo di un set di dati limitato in cui non è scontato che tutti muoiano, la mia interpretazione sopra è più accurata. Ma non sembra difficile per il lettore ignorarlo.

Potresti chiedere dove potresti incontrare persone che non muoiono. Per uno, potremmo lavorare con un set di dati statistici che tiene traccia delle persone solo per 5 anni, quindi quelli ancora vivi alla fine dello studio devono essere ignorati, poiché non si sa da cosa moriranno. In alternativa, la causa della morte potrebbe essere sconosciuta, nel qual caso non puoi davvero assegnarla alle auto o no alle auto.

Se ritieni che S1 e S2 siano diversi, in modo tale da indicare il secondo quando uno indica che il primo è fuorviante / errato, potresti fornire una revisione completa di S2 equivalente?

"Una persona su 80 che muore, lo fa a causa di un incidente d'auto." che equivale a riformulare S1.


yy

Ma quello era solo un sidenote. Quello che volevo dire è che questa risposta rileva solo un problema semantico ma manca il problema statistico che riguarda la situazione in cui la probabilità che un decesso sia causato da un incidente d'auto non è costante indipendentemente dal tempo. Questo lo rende diverso quando ci riferiamo a "è causato" (il passato) e "(morirà)" (il presente o il futuro).
Sesto Empirico

"Causa della morte" è un termine medico-legale che richiede un tempo latente per stabilire dal punto di vista medico, per riferire e raccogliere. Si può affermare ciò in retrospettiva quando la probabilità di perdere una causa di morte è ridotta, o altrimenti si correggono i dati mancanti, ad esempio includendo la segnalazione tardiva del precedente periodo di riferimento. Quindi, un'affermazione statisticamente corretta suona come qualcosa del genere: "Nella regione di raccolta dei dati geografici durante il periodo di tempo, le probabilità di morte attribuibili a incidenti stradali sono state stimate in uno su 80 morti".
Carl

7

Concordo sul fatto che la tua interpretazione della seconda affermazione sia coerente con la prima affermazione. Concordo anche sul fatto che sia un'interpretazione perfettamente ragionevole della seconda affermazione. Detto questo, la seconda affermazione è molto più ambigua.

La seconda affermazione può anche essere interpretata come:

  • Dato un campione di persone in un recente incidente d'auto, 1/80 è morto.
  • Dato un campione di popolazione in generale, 1/80 morirà a causa di fattori legati a un incidente d'auto, alcuni dei quali sono gli incidenti stessi, ma altri sono suicidi, lesioni, negligenza medica, giustizia vigilante, ecc.
  • Estrapolare le attuali tendenze di sicurezza indica che 1/80 di persone in vita oggi moriranno a causa di un incidente d'auto.

La seconda e la terza interpretazione sopra potrebbero essere abbastanza vicine per il pubblico laico, ma la prima è sostanzialmente diversa.


2
La prima interpretazione "1/80 di tutte le vittime in un incidente d'auto muoiono a causa dell'incidente" è come all'inizio ho interpretato la seconda affermazione. Anche se non penso che sia un'interpretazione corretta ed è più simile al risultato della lettura di scremature.
Sesto Empirico

5

La differenza fondamentale è che le due affermazioni si riferiscono a diverse popolazioni di esseri umani e a diversi intervalli di tempo.

"Uno su 80 decessi è causato da un incidente d'auto" presumibilmente si riferisce alla percentuale di decessi in un periodo di tempo abbastanza limitato (diciamo un anno). Poiché la percentuale della popolazione totale che utilizza le auto e il record di sicurezza delle auto sono cambiati in modo significativo nel tempo, la dichiarazione non ha alcun senso se non si indica a quale intervallo di tempo si riferisce. (A titolo di esempio ridicolo, sarebbe chiaramente stato completamente sbagliato per l'anno 1919, considerando il livello di proprietà e utilizzo dell'auto nella popolazione totale in quel momento). Si noti che la "percentuale della popolazione totale che utilizza automobili" in precedenza è in realtà un errore - dovrebbe essere "la proporzione di persone che moriranno nel prossimo futuro usando le automobili"

"Una persona su 80 muore a causa di un incidente d'auto" presumibilmente si riferisce a tutti gli umani che sono attualmente vivi in ​​alcune regioni e alla loro eventuale causa di morte in un futuro sconosciuto sconosciuto. Poiché la prevalenza e la sicurezza dei viaggi in auto cambieranno quasi sicuramente nel corso della loro vita (diciamo entro i prossimi 100 anni, per i neonati di oggi) questa è una dichiarazione molto diversa dalla prima.


3

A1) Supponendo che tutti muoiano e assumendo il contesto di un periodo di tempo sufficientemente piccolo attorno a quello in cui sono state prese le misurazioni, sì, la tua interpretazione di S2 corrisponde a S1.

A2) Sì, la tua interpretazione di S2 è sconsiderata. S2 può essere interpretato come "muore 1 persona su 80 coinvolta in incidenti stradali" che ovviamente non equivale a S1. Pertanto l'utilizzo di S2 potrebbe causare confusione.

La tua interpretazione di 1 su 80 è ragionevole, tuttavia, e l'altra interpretazione (1 in qualsiasi 80) è molto insolita. "1 in N di U è P" è una scorciatoia molto comune per "dato un predicato, P e N campioni casuali, x, dall'universo U, il numero atteso di campioni tale che P (x) è vero approssimativamente uguale a 1" .

A3) Fuori se tutte le persone, 1 su 80 muore a causa di un incidente d'auto.


Non spieghi la tua risposta ad A1. Tuttavia, ci sono state alcune risposte che affrontano altri problemi (dicendo di no ad A1). Potresti spiegare perché quelli non sono giusti?
Sesto Empirico,

@MartijnWeterings L'unica risposta che dice di no ad A1 sembra essere in disaccordo sulla base del fatto che in un periodo di tempo finito, non tutti muoiono in modo intenzionale. Pensi che la mia modifica sia indirizzata a questo?
Vaelus il

Penso che la frase che non indica che l'altro 79 sia morto per altre cause sia quindi ambigua. Quindi è meglio dichiarare l'altro.
Michael Chernick il

Vaelus, c'è un altro motivo per dire "no" ad A1. Questo motivo è che la frazione dei decessi dovuti a incidenti stradali potrebbe non dover essere costante nel tempo, quindi è ambigua e S1 e S2 hanno una prospettiva diversa rispetto a questa espressione (non costante).
Sesto Empirico

-1

Sì, è sbagliato e nessuno dei due frasi sembra sufficiente a trasmettere in modo coerente il significato desiderato

Parlando da laico, se il tuo obiettivo sono i laici, ti consiglio vivamente di postare su https://english.stackexchange.com/ , piuttosto che qui - la tua domanda mi ha portato alcune letture per districare ciò che S1 e S2 significano intuitivamente per me rispetto a ciò che intendevi dire.

Per la cronaca, le mie interpretazioni di ogni affermazione:

  • (S1) - per 80 morti, 1 morte per incidente stradale

  • (S2) - per 80 persone in un incidente d'auto, 1 morte

Per esprimere il tuo significato, probabilmente userei un S2 modificato: "Una persona su 80 morirà in un incidente d'auto".

Questo contiene ancora qualche ambiguità, ma mantiene una brevità simile.


Questo è un commento e non una risposta.
Michael Chernick il

1
@Michael Scusa, come mai? Non sto chiedendo chiarimenti, o sottolineando errori di battitura o altro - per favore fatemi sapere se la modifica aiuta.
ap55,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.