Sto cercando di trovare una formula, un metodo o un modello da utilizzare per analizzare la probabilità che un evento specifico abbia influenzato alcuni dati longitudinali. Sto avendo difficoltà a capire cosa cercare su Google.
Ecco uno scenario di esempio:
Immagina di possedere un'azienda che ha una media di 100 clienti walk-in ogni giorno. Un giorno, decidi di voler aumentare il numero di clienti walk-in che arrivano al tuo negozio ogni giorno, quindi fai una acrobazia fuori dal tuo negozio per attirare l'attenzione. Durante la settimana successiva, vedrai in media 125 clienti al giorno.
Nel corso dei prossimi mesi, deciderai ancora di voler guadagnare un po 'più di affari e forse di sostenerlo un po' più a lungo, quindi provi alcune altre cose casuali per ottenere più clienti nel tuo negozio. Sfortunatamente, non sei il miglior marketer e alcune delle tue tattiche hanno poco o nessun effetto e altre hanno anche un impatto negativo.
Quale metodologia posso usare per determinare la probabilità che un singolo evento abbia un impatto positivo o negativo sul numero di clienti walk-in? Sono pienamente consapevole del fatto che la correlazione non equivale necessariamente alla causalità, ma quali metodi posso utilizzare per determinare il probabile aumento o diminuzione nella camminata quotidiana della tua azienda nel seguire un evento specifico?
Non mi interessa analizzare se esiste una correlazione tra i tuoi tentativi di aumentare il numero di clienti walk-in, ma piuttosto se un singolo evento, indipendentemente da tutti gli altri, abbia avuto un impatto.
Mi rendo conto che questo esempio è piuttosto inventato e semplicistico, quindi ti darò anche una breve descrizione dei dati reali che sto usando:
Sto tentando di determinare l'impatto che una particolare agenzia di marketing ha sul sito Web dei loro clienti quando pubblicano nuovi contenuti, eseguono campagne sui social media, ecc. Per qualsiasi agenzia specifica, possono avere da 1 a 500 clienti. Ogni cliente ha siti Web di dimensioni che vanno da 5 pagine a oltre 1 milione. Nel corso degli ultimi 5 anni, ogni agenzia ha annotato tutto il proprio lavoro per ciascun cliente, incluso il tipo di lavoro svolto, il numero di pagine Web su un sito Web che sono state influenzate, il numero di ore trascorse, ecc.
Utilizzando i dati di cui sopra, che ho assemblato in un data warehouse (inserito in un gruppo di schemi a stella / fiocco di neve), devo determinare con quale probabilità un singolo pezzo di lavoro (un evento nel tempo) ha avuto un impatto su il traffico che colpisce qualsiasi / tutte le pagine influenzato da un lavoro specifico. Ho creato modelli per 40 diversi tipi di contenuti che si trovano su un sito Web che descrivono lo schema di traffico tipico che una pagina con tale tipo di contenuto potrebbe sperimentare dalla data di lancio fino ad oggi. Normalmente rispetto al modello appropriato, devo determinare il numero più alto e più basso di visitatori aumentati o diminuiti di una pagina specifica ricevuta a seguito di un lavoro specifico.
Mentre ho esperienza con l'analisi dei dati di base (regressione lineare e multipla, correlazione, ecc.), Non riesco a capire come affrontare questo problema. Mentre in passato ho analizzato in genere dati con più misurazioni per un dato asse (ad esempio temperatura vs sete vs animale e determinato l'impatto sulla sete che un aumento del temperato ha sugli animali), ritengo che sopra, sto provando ad analizzare l'impatto di un singolo evento ad un certo punto nel tempo per un set di dati longitudinale non lineare, ma prevedibile (o almeno in grado di modellare). Sono sconcertato :(
Qualsiasi aiuto, consigli, suggerimenti, consigli o indicazioni sarebbe estremamente utile e sarei eternamente grato!