Di seguito è riportato un istogramma di alcuni dati, i bin sono numeri interi mentre gli altri parametri sono irrilevanti.
Come puoi vedere, sembrano esserci due distribuzioni normali separate ma sovrapposte per numeri pari e dispari.
La probabilità di essere un numero pari è 1/3, allo stesso modo 2/3 per un numero dispari.
Non ho idea del reale significato statistico di questo per essere onesti, quindi sto cercando di scoprire cos'è anche per saperne di più, ma non riesco a trovare nulla, ho provato così tanti termini di ricerca per trovare questo e anche ricerche di immagini inverse ma tutto ciò che ottengo sono informazioni sulle distribuzioni multimodali ecc. e non riesco a trovare nulla su quando le distribuzioni multimodali si sovrappongono in questo modo
C'è un nome per questo?
Per chi è interessato, i dati provengono da 1.000.000 di giochi casuali di goofspiel (N = 13) usando lo script matlab
N = 1000000;
random = zeros(1,N);
for i = 1 : N
pc = randperm(13);
p1 = randperm(13);
p2 = randperm(13);
random(i) = sum(pc.*sign(p1-p2));
end
histogram(random,'BinMethod','integer')
Un esempio più generale (sebbene artificiale) sarebbe il seguente
a = [1:50 50:-1:1];
b = normpdf(linspace(-2,2),0,0.5).*50;
c = a;
rng('default') %For reproducibility
d = logical(randi([0,1],1,length(a)));
for i = 1:length(c) %There's gotta be a way to do this without an explicit loop
if(d(i))
c(i) = b(i);
end
end
bar(c)
Come nel primo esempio ci sono due distribuzioni sovrapposte (triangolare e normale), ma in questo caso invece di alternarsi in ciascun punto, è casuale.
So che questo è un esempio esagerato (e nemmeno un istogramma) ma ci devono essere esempi di questo tipo di cose che accadono effettivamente con i dati statistici, giusto? Allora di nuovo forse no, o è completamente irrilevante?
La vera domanda è duplice:
la domanda generale: come si chiama questo tipo di "cosa"? - in modo che io (o chiunque altro possa trovarlo) possa saperne di più e se è necessario apportare modifiche.
La domanda in quanto si riferisce specificamente al mio primo set di dati: dovrei separare i valori pari e dispari o adattare una distribuzione normale all'intero set?