Le risposte finora si sono concentrate sui dati stessi, il che ha senso con il sito in cui si trova e i difetti a riguardo.
Ma sono un epidemiologo computazionale / matematico per inclinazione, quindi parlerò anche del modello stesso per un po ', perché è anche rilevante per la discussione.
Nella mia mente, il problema più grande con la carta non sono i dati di Google. I modelli matematici in epidemiologia gestiscono continuamente dati disordinati e, a mio avviso, i problemi potrebbero essere affrontati con un'analisi della sensibilità abbastanza semplice.
Il problema più grande, secondo me, è che i ricercatori si sono "condannati al successo", cosa che dovrebbe sempre essere evitata nella ricerca. Lo fanno nel modello che hanno deciso di adattarsi ai dati: un modello SIR standard.
In breve, un modello SIR (che sta per (S) infettivo (I) recuperato (R) sensibile) è una serie di equazioni differenziali che tracciano gli stati di salute di una popolazione mentre sperimenta una malattia infettiva. Gli individui infetti interagiscono con gli individui sensibili e li infettano, quindi, con il passare del tempo, passano alla categoria recuperata.
Questo produce una curva che assomiglia a questa:
Bello no? E sì, questo è per un'epidemia di zombi. Lunga storia.
In questo caso, la linea rossa è ciò che viene modellato come "utenti di Facebook". Il problema è questo:
Nel modello SIR di base, la classe I alla fine, e inevitabilmente, si avvicinerà asintoticamente a zero .
Deve succedere Non importa se stai modellando zombi, morbillo, Facebook o Stack Exchange, ecc. Se lo modelli con un modello SIR, la conclusione inevitabile è che la popolazione della classe infettiva (I) scende a circa zero.
Ci sono estensioni estremamente semplici al modello SIR che rendono questo non vero - o puoi far sì che le persone nella classe recuperata (R) tornino alla suscettibile (S) (essenzialmente, queste sarebbero persone che hanno lasciato Facebook cambiando da "Sono mai tornare "a" Potrei tornare un giorno "), oppure puoi avere nuove persone entrare nella popolazione (questo sarebbe il piccolo Timmy e Claire che ottengono i loro primi computer).
Sfortunatamente, gli autori non si adattavano a quei modelli. Per inciso, questo è un problema diffuso nella modellistica matematica. Un modello statistico è un tentativo di descrivere i modelli di variabili e le loro interazioni all'interno dei dati. Un modello matematico è un'affermazione sulla realtà . È possibile ottenere un modello SIR per adattarsi a molte cose, ma la scelta di un modello SIR è anche un'affermazione sul sistema. Vale a dire, che una volta che raggiunge il picco, sta andando a zero.
Per inciso, le aziende di Internet usano modelli di fidelizzazione degli utenti che assomigliano molto ai modelli epidemici, ma sono anche considerevolmente più complessi di quello presentato nel documento.