Ho dati su una serie di scommesse vincenti e perdenti su 5 round di scommesse con logoramento dopo ogni round. Sto usando un albero decisionale come il seguente per visualizzare i dati.
I nodi verso la cima dell'albero sono quelli che stanno scommettendo vincenti, e quelli verso la parte inferiore dell'albero stanno correndo delle scommesse perdenti. Voglio esaminare (a) l'attrito in ciascun nodo (b) i cambiamenti nelle dimensioni della scommessa media su ciascun nodo. Sto osservando il tasso di logoramento in ciascun nodo dal nodo precedente e il tasso di sopravvivenza (usando la quantità prevista di persone in ciascun nodo se la probabilità è del 50%). Ad esempio, se la probabilità è del 50% su ciascun nodo, su 1000 iniziati, circa 500 persone dovrebbero trovarsi in ciascuno dei secondi nodi, W e L. L'ipotesi è (a) che il tasso di attrito sia maggiore dopo aver perso scommesse (b) significa che la dimensione della scommessa viene ridotta dopo i perdenti e aumentata dopo i vincitori.
Voglio solo farlo prima in un ambiente univariato molto semplice. Come posso eseguire un test t per mostrare che la variazione della dimensione della scommessa media dal nodo WW al nodo WWW è statisticamente significativa se 50 persone hanno abbandonato? Non sono sicuro che questo sia l'approccio giusto: ogni scommessa successiva è indipendente, ma le persone stanno abbandonando dopo i perdenti, quindi il campione non è abbinato. Se fosse solo un caso della stessa classe a sostenere una serie di esami uno dopo l'altro senza che nessuno si ritirasse, avrei capito come eseguire il test t appropriato, ma penso che questo sia un po 'diverso.
Come posso fare questo? Inoltre, se i risultati vengono distorti da un numero limitato di clienti, come potrei ottenere il 5% superiore e il 5% inferiore? Rimuovere i clienti con la puntata cumulativa più alta dalla puntata 1 - 3?
Ho i dati da cui è stata generata la figura, quindi ho ogni errore medio, standard, standard, ecc.