Utilizzo dell'analisi delle serie storiche per analizzare / prevedere comportamenti violenti


13

Questa è una domanda un po 'irriverente, ma ho un serio interesse per la risposta. Lavoro in un ospedale psichiatrico e ho tre anni di dati, raccolti ogni giorno in ogni reparto riguardo al livello di violenza in quel reparto.

Chiaramente il modello che si adatta a questi dati è un modello di serie storiche. Ho dovuto differenziare i punteggi per renderli più normali. Adatto un modello ARMA con i dati differenziati e la migliore che ritengo fosse un modello con un grado di differenziazione e autocorrelazione del primo ordine a ritardo 2.

La mia domanda è: per quale motivo posso usare questo modello? Le serie storiche sembrano sempre così utili nei libri di testo quando si tratta di popolazioni di lepri e di prezzi del petrolio, ma ora ho fatto il mio e il risultato sembra così astratto da essere completamente opaco. I punteggi differenziati sono correlati tra loro al secondo ritardo, ma non posso davvero consigliare a tutti di essere in allerta due giorni dopo un incidente grave in tutta serietà.

O posso?


potresti modificare il titolo in qualcosa del tipo "Utilizzo dell'analisi delle serie storiche per analizzare / prevedere comportamenti violenti"?
Paul,

1
Mi piace molto questo tipo di domanda, penso che questo tipo di preciso problema reale aumenterà l'interesse del sito. Sarebbe ancora meglio se tu avessi la possibilità di aggiungere un link ai dati o di dirci (come complemento del post) cosa hai fatto finalmente, quali sono state le conclusioni .... comunque capisco che questo può essere confidenziale ...
Robin Girard,

Vorrei poter votare nuovamente per farti passare la domanda sulla definizione di una variabile casuale;)
robin girard

Tornerò per dirti quali sono stati i risultati, ma ci vorrà un po 'mentre sto lavorando a questo insieme a molte altre attività. Non sapevi cosa volevi dire "passa la domanda sulla variabile casuale"? C'è una domanda che mi consiglia di guardare?
Chris Beeley,

scusa se non sono stato chiaro, intendo dire che preferisco domande (opinione personale soggettiva) come la tua alla domanda che si pone "cos'è una variabile casuale" ... ma suppongo che il mio piacere non sia quello di tutti :)
Robin Girard,

Risposte:


9

Il modello che si adatta ai dati non deve essere un modello di serie temporale; Consiglierei di pensare un po 'fuori dagli schemi.

Se hai più variabili (ad es. Età, sesso, dieta, etnia, malattia, farmaci) puoi usarle per un modello diverso. Forse avere determinati pazienti nella stessa stanza è un predittore importante? O forse ha a che fare con il personale presente? Oppure prendere in considerazione l'utilizzo di un modello di serie temporali multi-variabile (ad esempio VECM) se si dispone di altre variabili che è possibile utilizzare. Guarda le relazioni tra violenza tra i pazienti: alcuni pazienti agiscono insieme?

Il modello di serie storiche è utile se il tempo ha un ruolo importante nel comportamento. Ad esempio, potrebbe esserci un ammasso di violenza. Guarda la letteratura sul raggruppamento della volatilità. Come suggerisce @Jonas, con un ordine di ritardo di 2, potrebbe essere necessario essere in allerta più alta il giorno successivo a un'esplosione di violenza. Ma questo non ti aiuta a prevenire il primo giorno: potrebbero esserci altre informazioni che puoi collegare all'analisi per comprendere effettivamente la causa della violenza, piuttosto che semplicemente prevederla in modo cronologico.

Infine, come suggerimento tecnico: se stai usando R per l'analisi, potresti dare un'occhiata al pacchetto di previsioni di Rob Hyndman (il creatore di questo sito). Questo ha molte caratteristiche molto belle; vedere il documento "Previsione automatica delle serie storiche: il pacchetto di previsioni per R" nel Journal of Statistical Software.


1
D'accordo - solo per lanciare alcune idee aggiuntive sulla modellazione: logistica per prevedere quali pazienti avranno 1+ esplosioni violente, regressione di Poisson (esque) per prevedere quali pazienti avranno molte esplosioni, multilivello per esaminare le variazioni da una stanza all'altra e / o rione ...
Matt Parker,

1
+1 È facile essere accecati dalle esortazioni a non usare modelli lineari, ecc. Su serie temporali a causa di problemi di auto-correlazione, e rimanere invischiati in ARIMA, DLM, ecc., Quando LM, GLM, ecc. Possono essere abbastanza potenti con un po 'di cautela.
Wayne,

6

Hai adattato il modello alle differenze, il che significa che stai descrivendo il cambiamento nei livelli di violenza. Hai un ritardo di 2 giorni. Un ritardo è indicativo della memoria del processo. In altre parole, il cambiamento nei livelli di violenza oggi ha una certa dipendenza dal cambiamento nei livelli di violenza negli ultimi due giorni. Per scale temporali più lunghe, il contributo di influenze casuali diventa abbastanza forte da non rendere più chiaro il collegamento.

L'auto-correlazione è positiva? Quindi un cambiamento dei livelli di violenza oggi suggerisce un cambiamento simile nei livelli di violenza in due giorni. È negativo? Quindi la violenza potrebbe rimanere più alta per due giorni.

Naturalmente, potresti voler controllare gli effetti confondenti. Ad esempio, dopo un grave incidente, è più probabile che le persone segnalino incidenti minori, ma questa "sensibilizzazione" scomparirebbe dopo due giorni.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.