Facebook sta per finire?


138

Recentemente, questo documento ha ricevuto molta attenzione (ad esempio da WSJ ). Fondamentalmente, gli autori concludono che Facebook perderà l'80% dei suoi membri entro il 2017.

Basano le loro affermazioni su un'estrapolazione del modello SIR , un modello compartimentale spesso utilizzato in epidemiologia. I loro dati sono tratti dalle ricerche di Google per "Facebook" e gli autori usano la scomparsa di Myspace per convalidare la loro conclusione.

Domanda:

Gli autori stanno commettendo un errore "la correlazione non implica la causalità"? Questo modello e questa logica potrebbero aver funzionato per Myspace, ma sono validi per qualsiasi social network?

Aggiornamento : Facebook risponde

In linea con il principio scientifico "la correlazione equivale alla causalità", la nostra ricerca ha dimostrato inequivocabilmente che Princeton potrebbe essere in pericolo di scomparire del tutto.

Non pensiamo davvero che Princeton o la fornitura di aria del mondo arriveranno presto da nessuna parte. Adoriamo Princeton (e l'aria) "e aggiungendo un ultimo promemoria che" non tutte le ricerche sono uguali - e alcuni metodi di analisi portano a conclusioni piuttosto folli.


26
Bene, il numero di ricerche su Facebook potrebbe aumentare in base a questo articolo. ;)
RobertF,


15
@Glen Mr. Develin sembra aver perso completamente il punto dello studio. In primo luogo, non si tratta semplicemente di prevedere una tendenza nelle ricerche, ma di usarle per convalidare e calibrare un modello della famosa famiglia SIR, che si ritiene sia un buon descrittore dell'adozione e dell'abbandono della moda. In secondo luogo, i suoi contro-esempi "intelligenti" falliscono perché, a differenza di Facebook, né Princeton né Air vengono utilizzati principalmente online. Canta il canto di correlazione-causalità, ma la correlazione è su MySpace e Facebook, non sui dati storici di Facebook. Inoltre, c'è un conflitto di interessi.
Superbo

6
L'analisi è ironica. Il punto di estrapolazione come se nulla cambi è valido, come hanno descritto le due risposte.
Glen,

5
Questo non risponde alla domanda ma è semplicemente un mucchio di opinioni personali, totalmente estranee alle statistiche.
Ziggystar,

Risposte:


165

Le risposte finora si sono concentrate sui dati stessi, il che ha senso con il sito in cui si trova e i difetti a riguardo.

Ma sono un epidemiologo computazionale / matematico per inclinazione, quindi parlerò anche del modello stesso per un po ', perché è anche rilevante per la discussione.

Nella mia mente, il problema più grande con la carta non sono i dati di Google. I modelli matematici in epidemiologia gestiscono continuamente dati disordinati e, a mio avviso, i problemi potrebbero essere affrontati con un'analisi della sensibilità abbastanza semplice.

Il problema più grande, secondo me, è che i ricercatori si sono "condannati al successo", cosa che dovrebbe sempre essere evitata nella ricerca. Lo fanno nel modello che hanno deciso di adattarsi ai dati: un modello SIR standard.

In breve, un modello SIR (che sta per (S) infettivo (I) recuperato (R) sensibile) è una serie di equazioni differenziali che tracciano gli stati di salute di una popolazione mentre sperimenta una malattia infettiva. Gli individui infetti interagiscono con gli individui sensibili e li infettano, quindi, con il passare del tempo, passano alla categoria recuperata.

Questo produce una curva che assomiglia a questa:

Inserisci qui la descrizione dell'immagine

Bello no? E sì, questo è per un'epidemia di zombi. Lunga storia.

In questo caso, la linea rossa è ciò che viene modellato come "utenti di Facebook". Il problema è questo:

Nel modello SIR di base, la classe I alla fine, e inevitabilmente, si avvicinerà asintoticamente a zero .

Deve succedere Non importa se stai modellando zombi, morbillo, Facebook o Stack Exchange, ecc. Se lo modelli con un modello SIR, la conclusione inevitabile è che la popolazione della classe infettiva (I) scende a circa zero.

Ci sono estensioni estremamente semplici al modello SIR che rendono questo non vero - o puoi far sì che le persone nella classe recuperata (R) tornino alla suscettibile (S) (essenzialmente, queste sarebbero persone che hanno lasciato Facebook cambiando da "Sono mai tornare "a" Potrei tornare un giorno "), oppure puoi avere nuove persone entrare nella popolazione (questo sarebbe il piccolo Timmy e Claire che ottengono i loro primi computer).

Sfortunatamente, gli autori non si adattavano a quei modelli. Per inciso, questo è un problema diffuso nella modellistica matematica. Un modello statistico è un tentativo di descrivere i modelli di variabili e le loro interazioni all'interno dei dati. Un modello matematico è un'affermazione sulla realtà . È possibile ottenere un modello SIR per adattarsi a molte cose, ma la scelta di un modello SIR è anche un'affermazione sul sistema. Vale a dire, che una volta che raggiunge il picco, sta andando a zero.

Per inciso, le aziende di Internet usano modelli di fidelizzazione degli utenti che assomigliano molto ai modelli epidemici, ma sono anche considerevolmente più complessi di quello presentato nel documento.


4
Sì, mi mancavano anche altri modelli. Non sono a conoscenza dei modelli di epidemiologia, ma sono a conoscenza dei modelli di curva a S utilizzati nel marketing. C'era un articolo di revisione (Meade, Islam, Previsioni tecnologiche - Selezione del modello, Stabilità del modello e modelli combinati, Scienza della gestione, 1998, Vol 44, No 8.) che elencava come 30 modelli diversi. La maggior parte di questi modelli ha ragionamenti simili, invece di essere suscettibili, contagiosi e guariti usano i termini early adopter e immitator (o simili). Il modello è quindi la soluzione per alcune equazioni differenziali.
mpiktas,

1
Non hai quasi bisogno di giustificare parlare del modello statistico qui su Cross Validated (CV) ... Stai suggerendo che non parlare del modello è un difetto del CV stesso? In ogni caso, un chiarimento sarebbe utile se si desidera promuovere la consapevolezza o criticare in modo costruttivo a questo proposito, davvero. In alternativa, se è una tangente che non vale la pena chiarire, come vale la pena menzionarla? Per quanto riguarda il suggerimento (involontario?) Secondo cui gli utenti di Facebook sono zombi ... Non ho obiezioni. (Anche se io sono uno! :)
Nick Stauner,

4
gli zombi sono fantastici! ... fino a quando non ti mordono: P
Joe DF

13
(+1) Questa è stata la mia lamentela principale con il loro articolo. Hanno assunto un modello che prevede necessariamente un arresto anomalo e quindi hanno convalidato il modello selezionando in modo accurato un singolo sito che mostrava il comportamento previsto (MySpace). Le ripetizioni significative per questo tipo di modello sono il numero di siti comparabili e lo hanno testato su uno.
ragazzo

11
@NickStauner No, è stata semplicemente un'osservazione che la maggior parte delle critiche qui (e in effetti, nel resto dei siti Internet) riguardavano i dati stessi. Il che significa che i dati stessi sono qualcosa che la maggior parte degli utenti qui potrebbe facilmente criticare, mentre i dettagli reali del modello non sono qualcosa che mi aspetto che "Statistico medio / Esperto di apprendimento automatico" abbia necessariamente incontrato.
Fomite,

111

La mia preoccupazione principale per questo documento è che si concentra principalmente sui risultati di ricerca di Google. È risaputo che l'utilizzo dello smartphone è in aumento ( Pew Internet , Brandwatch ) e che le vendite di computer tradizionali sono in calo (probabilmente solo a causa dei vecchi computer ancora funzionanti) ( Slate , ExtremeTech), poiché più persone utilizzano gli smartphone per accedere a Internet. Considerando che esiste un'app nativa di Facebook per (almeno) iOS, Android, Blackberry e Windows Phone, non sorprende che il numero di query di Google per "Facebook" sia diminuito in modo significativo. Se gli utenti non devono più aprire un browser e digitare "facebook.com" nella barra degli URL, ciò avrebbe sicuramente un impatto negativo sul numero di ricerche. In effetti, il numero di utenti FB che utilizzano l'app è aumentato in modo significativo ( TechCrunch , Forbes ).

Penso che questo studio sia solo una "eh, interessante correlazione" che è stata portata troppo lontano dai media allarmisti; "Sapevi che il mondo sta cambiando? Che imprevisto!"


3
Molto bene, come hai detto, l'uso degli smartphone è in aumento e Facebook riceve enormi quantità di visite mensili da cellulari / smartphone. Solo perché le persone non lo stanno cercando non significa che causerà una diminuzione dell'uso di Facebook, il modo in cui le persone usano Facebook sta cambiando / cambiato. Non lo stanno più cercando, stanno semplicemente facendo clic sull'icona sul loro telefono e ci stanno andando.
MCP_infiltrator

2
Stavo per rispondere allo stesso modo su smartphone e ricerche su Google
syed mohsin

"Considerando che esiste un'app nativa di Facebook per (almeno) iOS, Android, Blackberry e Windows Phone, non sorprende che il numero di query di Google per" Facebook "sia diminuito in modo significativo" ... la ricerca è anche su smartphone e c'è questa cosa chiamata segnalibro che è implementata su ogni browser.
Jeffrey Blattman,

@JeffreyBlattman "c'è questa cosa chiamata segnalibro che è implementata su ogni browser" .. tranne in Opera 15+. :)
landroni il

2
I segnalibri di @Adrian sono la funzionalità di base di un browser e esistono su tutti i browser esistenti dal giorno in cui il web è stato acceso.
Jeffrey Blattman,

61

Bene, questo documento dimostra il fatto che il numero di ricerche di Google su Facebook si adatta bene a una certa curva. Quindi, nella migliore delle ipotesi, può prevedere che le ricerche su Facebook diminuiranno dell'80%. Il che potrebbe essere fattibile, perché Facebook potrebbe diventare così onnipresente che nessuno avrebbe bisogno di cercarlo.

Il problema con questo tipo di modelli è che ipotizzano che nessun altro fattore possa influenzare la dinamica della variabile osservata. Questa ipotesi è difficile da giustificare quando si tratta di dati relativi alle persone. Ad esempio, questo modello presuppone che Facebook non possa fare nulla per contrastare la perdita dei suoi utenti, il che è un presupposto molto discutibile da fare.


3
E il primo paragrafo di mpiktas tocca anche un buon punto: gli autori stanno utilizzando le query di ricerca di Google come proxy per il numero di account Facebook. Perché non andare direttamente ai dati dell'account? Non è difficile da trovare: news.yahoo.com/number-active-users-facebook-over-230449748.html
RobertF

Sebbene sia giusto, rappresentare graficamente i dati dall'articolo sopra mostra che il numero di utenti attivi era vicino al picco nel 2013.
RobertF,

4
Fattori diversi dalla dinamica dell'infezione da paziente a paziente possono influenzare la diffusione della malattia (come i programmi di sanità pubblica). Ciò non impedisce al modello sottostante di essere utile. Non credo che la data esatta della morte di Facebook (che senza dubbio possa essere influenzata) sia interessante quanto l'idea / modello secondo cui i social network si diffondono come malattie.
david25272,

3
@ david25272 Questo tipo di modelli sono sicuramente utili, c'è un'intera letteratura nel marketing riguardante le curve a S che usa approcci simili. Ad esempio, sospetto che il modello di Bass e le sue controparti possano adattarsi abbastanza bene agli stessi dati.
mpiktas,

15

Google Trend secondo me non può produrre un buon set di dati per questo caso di studio. La tendenza di Google mostra la frequenza con cui un termine viene cercato con Google, quindi ci sono almeno due ragioni per sollevare alcuni dubbi sulla previsione:

  • Non sappiamo se l'utente cerca su Google Facebook per accedere o se cerca informazioni su Facebook

Facebook non è solo un sito è un fenomeno, con molti articoli, libri e un film su di esso e Facebook Inc. il 18 maggio 2012 ha iniziato a vendere azioni al pubblico e commerciare sul NASDAQ. Google Trend ti mostra entrambi: le ricerche per il sito e le ricerche per il "fenomeno". Le cose nuove hanno sempre un grande impatto sulla massa, la TV ha avuto un grande impatto sulla massa, ora nessuno ci scrive articoli ma è ancora uno degli apparecchi più utilizzati.

  • La maggior parte degli utenti non cerca "facebook" su Google per accedere

Con le applicazioni mobili e i segnalibri un utente con una discreta conoscenza della ricerca su Internet "Facebook" su Google solo la prima volta, di solito salva la pagina come segnalibro o scarica l'applicazione. Il grafico sotto è la tendenza di Google per Wikipedia , sembra che non useremo Wikipedia in futuro. Ovviamente questo non è vero, semplicemente non accediamo a wikipedia digitando "wikipedia" semplicemente cerchiamo e quindi usiamo la pagina di wikipedia o usiamo il segnalibro per accedervi.

inserisci qui la descrizione dell'immagine


4
Non dimenticare il completamento automatico della cronologia del browser nella barra degli indirizzi. Digito la lettera "f" in Chrome o Firefox e si completa automaticamente su facebook.com come primo suggerimento. Questa funzione è attiva da diversi anni.
Paolo

4
Most users don't search "facebook" on Google to login... Scommetto una taglia di 50 che questo è davvero lo scopo della maggior parte di quelle ricerche.
Evgeni Sergeev,

2
@EvgeniSergeev Scommetto anche con te! la tua ipotesi non contraddice la mia affermazione, penso che questo sia il motivo di quelle ricerche, ma in realtà non è il metodo più usato per accedere a Facebook (e questo è ciò che conta per lo studio) un semplice fatto è che l'anno scorso gli utenti mobili di Facebook ha superato gli utenti desktop
GM

13

Alcuni problemi di base si distinguono con questo documento:

  • Presuppone la correlazione delle query dei motori di ricerca su un social network in aumento con l'aumento degli iscritti. Questo potrebbe essere correlato in passato, ma potrebbe non in futuro.

  • Esistono pochissimi nuovi grandi social network. Puoi quasi contarli su una mano. Amico, Myspace, Facebook, Google+. Inoltre, Stack Exchange, Tumblr e Twitter funzionano in modo simile ai social network. Qualcuno ha previsto che Twitter sia finito? Al contrario, sembra avere un grande slancio. Non c'è molta menzione o studio di altri per vedere se si adattano. In un modo di cui stiamo parlando, esiste una tendenza tra 5-7 punti dati? (Il numero di social network.) Sono solo pochi i dati per trarre conclusioni sul futuro.

  • Facebook ha sostituito Myspace. Questa era la principale dinamica. Non considera l'idea che una infezione ne stia sostituendo un'altra, tende a considerarle separatamente. Cosa sta sostituendo Facebook? Google+? Twitter? L'interazione e la "defezione" dei clienti da un "marchio" o "prodotto" all'altro è il fenomeno critico in questo settore.

  • I social network coesistono. Uno può essere un membro di più siti. È vero che i membri possono tendere a preferire l'uno all'altro.

  • Sembrerebbe un modello molto migliore è che c'è un consolidamento in corso, come in economia, come per le automobili, i produttori di radio, i siti web, ecc. Come in ogni nuova tecnologia dirompente, ci sono molti concorrenti all'inizio, e poi , più tardi, il campo si restringe, tendono a consolidarsi, ci sono acquisizioni e fusioni e alcuni si estinguono nella competizione. Ne vediamo già esempi, ad esempio Yahoo che ha acquistato Tumblr di recente.

  • Un concetto simile potrebbe essere con le reti televisive che si consolidano e sono di proprietà di grandi conglomerati, ad esempio le principali società di media che possiedono molte risorse multimediali. In effetti, Myspace è stato acquistato da News Corporation.

  • La strada da percorrere è cercare ulteriori analogie tra economia e infezioni (biologia). Le aziende che acquisiscono clienti dai concorrenti e l'assorbimento dei prodotti presentano effettivamente molti parallelismi epidemiologici. Ci sono forti parallelismi con le razze evolutive della "regina rossa" [vedi il libro, Red Queen di Ridley ]. Potrebbero esserci connessioni a un campo chiamato bionomica .

  • Un altro modello di base sono i prodotti in concorrenza tra loro e che presentano vari "ostacoli all'ingresso" per consentire ai clienti di passare da un marchio all'altro. È vero che il costo del passaggio è molto basso nel cyberspazio. È simile ai marchi di birre in competizione per i clienti, ecc.

  • In un modello asintotico, è molto più probabile che una rete aumenti i suoi membri verso un certo massimo asintotico e quindi tende al plateau . All'inizio dell'altopiano, non sarà evidente che si tratta di un altopiano.

Detto questo, penso che abbia alcune idee molto valide e coinvolgenti e probabilmente stimolerà ulteriori ricerche. È innovativo, pioneristico e deve solo essere leggermente adattato nelle sue affermazioni. Sono felice di questo uso di Stack Exchange e della saggezza collaborativa / intelligenza collettiva che analizza questo documento. (Ora se solo i giornalisti che effettuano ricerche sull'argomento leggano attentamente l'intera pagina prima di preparare i loro morsi sonori semplicistici.)


2
tra la terminologia. "barriere all'ingresso" viene utilizzato per indicare le aziende che vogliono rilasciare nuovi prodotti e competere in una nuova area, concetto simile si applica "dall'altra parte della transazione" ai clienti che cambiano prodotto, ma forse c'è un termine diverso lì? comunque gli autori devono legare le loro idee con il marketing che sta effettivamente usando modelli più "virali". anche un concetto chiave in questo settore [avrebbe dovuto menzionarlo sopra] è la quota di mercato .
vzn

1
ps forse una domanda molto più rilevante che è supportata da altre ricerche recenti in questo settore: la crescita di Facebook sta volgendo al termine . l'utilizzo è sceso nella demografia degli adolescenti, ad esempio (il che è abbastanza notevole perché il suo aumento iniziale era dovuto agli adolescenti). numerosi studi / esperti recenti lo confermano. pertanto, osservare i turni demografici dei gruppi è anche la chiave per comprendere le tendenze di utilizzo dei social network. Inoltre, Facebook sta tentando di espandersi a livello internazionale dopo aver "saturato" negli Stati Uniti e lì le barriere sono cose come un minor numero di reti Internet, telefoni cellulari / computer, ecc ...
vzn

6

La domanda non è "se" ma "quando".

Che finirà è già garantito. http://www.ted.com/talks/geoffrey_west_the_surprising_math_of_cities_and_corporations.html

Mi prendo in giro con l'uso del modello SIR. Viene con ipotesi.

Uno dei presupposti è che alla fine tutti vengono "recuperati". Le infezioni non sono perpetue, mentre può essere l'adozione della tecnologia (ad esempio, considerare l'automobile).

Se l'azienda è destinata a morire alla fine, allora quando si attraversa la morte, le relazioni tra suscettibili, infette e recuperate potrebbero essere adeguatamente modellate da un particolare modello SIR. Ciò non significa che il modello sia descrittivo di nessuna delle stagioni prima della fine della vita. Non tiene conto di altre forze: il contesto. Facebook faceva parte del contesto di fine di "Myspace" e quindi mentre un SIR era appropriato per l'uso solo di Myspace, non era per l'uso sui social network perché molti utenti avevano account su entrambi e passavano all'utilizzo dominante in FB.

Ho scavato attraverso il modello di zombi, e anche attraverso alcuni attacchi SIR non zombi, e un SIR a finestra punteggiata di tempo e popolazione è più appropriato lì. Non è un modello universale e ha punti di forza e di debolezza. Ciò significa che il SIR è imperfetto anche per i sistemi su cui è stato progettato per modellare. Tale imperfezione fondamentale per il suo target suggerisce che senza un uso attento, l'applicazione al di fuori dell'area target può essere più problematica di altri modelli.


2

Per rispondere alla tua domanda

Questo modello e questa logica potrebbero aver funzionato per MySpace, ma sono validi per qualsiasi social network?

Probabilmente no. I dati storici possono prevedere eventi futuri solo se "l'ambiente" è simile. Questo documento presuppone che il totale degli utenti e delle query di Google sia una costante, il che ovviamente non lo è. Ora questo articolo potrebbe dire di più su Google che su Facebook.

Tuttavia, sulla base della rapida ascesa e caduta di molti altri social network come MySpace e altri, penso che si possa tranquillamente supporre che ci sarà una grande possibilità che Facebook non sarà più il social network dominante tra 5 anni.


Le previsioni non dipendono interamente dalla somiglianza ambientale (ovviamente dipende da cosa intendi per "ambiente"). Tuttavia, la tua risposta sembra internamente incoerente. Non è sicuro supporre che il futuro di Facebook assomiglierà ai corsi di altri social network solo su quella base, tanto meno in un arco di tempo così breve.
Nick Stauner,

La mia previsione sul futuro di Facebook è un'opinione per la quale utilizzo un argomento. La mia opinione chiaramente non si basa su statistiche o modelli. La previsione nel documento discusso qui si basa su statistiche e modelli con riferimento storico. Non vedo perché la mia risposta sia internamente incoerente.
Nebu,

1
L'unica argomentazione a sostegno della tua opinione suona moltissimo come la logica dietro il modello che critichi per quella stessa logica. Se l'ambiente (generazionale?) Non è abbastanza simile ora a quando il modello si adatta a Myspace, perché è abbastanza simile da basare qualsiasi opinione sulla storia di Myspace? Inoltre, Facebook è davvero solo un altro social network che si comporterà come tutti gli altri? È abbastanza diverso per il dubbio in molti modi, come lo sono i tempi, quindi di nuovo, non vedo come sia sicuro supporre che la sua possibilità di un destino simile sia grande in un arco di tempo così breve .
Nick Stauner,

1

Se diamo uno sguardo alla mappa dei social network, ci sono alcuni casi in cui si applica il modello epidemico.

http://vincos.it/world-map-of-social-networks/

L'articolo potrebbe avere altri esempi (Friendster e Orkut sono un buon esempio di declinazione massiccia dei suoi utenti) e anche tenendo conto del fatto che normalmente le persone migrano verso altri social network che offrono servizi migliori o nuovi .

Facebook innova il modo in cui le persone comunicano. Rispetto a Orkut , un utente doveva inserire un profilo di un'altra persona per vedere i suoi aggiornamenti. D'altra parte su Facebook i feed sono ora sulla sua sequenza temporale. Questo è un grande cambiamento.

Questo modello e questa logica potrebbero aver funzionato per MySpace, ma sono validi per qualsiasi social network?

IMHO, le persone non escono dai social network. Migrano, in base a un servizio, funzionalità o esperienza migliori.

La domanda è: ci sarà un social network migliore? Forse Google +.


2
Questa risposta non sembra rispondere alle domande, che sono (1) statistiche sulla possibile confusione della correlazione con la causalità e (2) se ci si può aspettare che un modello predittivo si applichi universalmente. Se ho frainteso, forse è perché non è affatto evidente quale sia il referente di "questo" nella prima frase.
whuber

2
@whuber Questa risposta afferma che non vi è alcuna correlazione finché le persone hanno ancora bisogno dei social network. A meno che non ci sia un'alternativa migliore a Facebook (di cui il documento nella domanda non tiene conto), allora Facebook sarà il re. Statisticamente, l'esigenza del "social network" è cresciuta e le persone sono semplicemente migrate da un social network a un altro. L'uso dei social network è cresciuto solo finora.
Tiberiu-Ionuț Stan,

2
@ Tiberiu-Ionuț Stan Il tuo commento potrebbe essere corretto ma è costituito solo da osservazioni non supportate sui social network; non sembra contenere alcun ragionamento statistico né gettare ulteriore luce sulla questione. In particolare, non riesco ancora a vedere alcun riferimento specifico in questa particolare risposta a correlazione o causalità. Ricorda, non siamo qui per discutere del futuro di Facebook o della qualità dei social network, ma piuttosto ci è stato chiesto di valutare gli argomenti statistici nel documento in questione.
whuber

@whuber Sto cercando di valutare gli argomenti statistici del documento mostrando i motivi alla base dei risultati. Il documento non tiene conto degli altri OSN e delle tendenze emergenti, ma solo dei numeri. Sto solo aggiungendo informazioni. IMO è lo stesso dell'analisi tecnica e fondamentale nel mercato azionario (entrambi sono ok). Sto cercando di spiegare i fatti alla base del cambiamento, non solo numeri e grafici.
edubriguenti,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.