Risolvo i cubi di Rubik come hobby. Annoto il tempo impiegato per risolvere il cubo utilizzando alcuni software, quindi ora ho i dati di migliaia di soluzioni. I dati sono sostanzialmente un lungo elenco di numeri che rappresentano il tempo impiegato da ciascuna risoluzione sequenziale (ad es. 22.11, 20.66, 21.00, 18.74, ...)
Il tempo necessario per risolvere il cubo varia in modo naturale da una soluzione all'altra, quindi ci sono buone soluzioni e cattive soluzioni.
Voglio sapere se "mi surriscaldo" - se i buoni risolutori si presentano a strisce. Ad esempio, se ho appena avuto alcuni buoni consecutivi, è più probabile che la mia prossima soluzione sia buona?
Quale tipo di analisi sarebbe appropriata? Mi vengono in mente alcune cose specifiche da fare, ad esempio trattare i risolventi come un processo di Markov e vedere quanto bene una soluzione prevede il prossimo e confrontarli con dati casuali, vedere per quanto tempo le strisce più lunghe di risoluzioni consecutive sotto la mediana per l'ultimo 100 sono e in confronto a ciò che ci si aspetterebbe da dati casuali, ecc. Non sono sicuro di quanto siano approfonditi questi test e mi chiedo se ci siano approcci ben sviluppati a questo tipo di problema.