Ho due serie di dati che rappresentano i parametri stelle: uno osservato e uno modellato. Con questi set creo quello che viene chiamato un diagramma a due colori (TCD). Un esempio può essere visto qui:
A essendo i dati osservati e B i dati estratti dal modello (non importa le linee nere, i punti rappresentano i dati) Ho solo un diagramma A , ma posso produrre tutti i diversi diagrammi B che voglio e quello di cui ho bisogno è per mantenere quella che meglio si adatta a .
Quindi quello di cui ho bisogno è un modo affidabile per verificare la bontà dell'adattamento del diagramma B (modello) al diagramma A (osservato).
In questo momento quello che faccio è creare un istogramma o una griglia 2D (questo è quello che io chiamo, forse ha un nome più appropriato) per ogni diagramma binning di entrambi gli assi (100 bin per ciascuno) Quindi passo attraverso ogni cella della griglia e trovo il differenza assoluta nei conteggi tra A e B per quella particolare cella. Dopo aver attraversato tutte le celle, che sommare i valori per ogni cella e così alla fine con un singolo parametro positivo che rappresenta la bontà di adattamento ( ) tra A e B . Il più vicino a zero, migliore è la misura. Fondamentalmente, questo è l'aspetto di quel parametro:
; dove a i j è il numero di stelle nel diagrammaAper quella particolare cella (determinato da ) e b i j è il numeroB.
Questo è ciò che quelle differenze nella conta di ogni cella sembrano nella griglia che creo (nota che non sto usando valori assoluti di ( a i j - b i in questa immagine ma iofacciousarle per il calcolo del g f parametri):
Il problema è che mi è stato consigliato che questo potrebbe non essere un buon stimatore, principalmente perché oltre a dire che questa misura è migliore di questa perché il parametro è più basso , non posso davvero dire altro.
Importante :
(grazie @PeterEllis per averlo segnalato)
1- Punti in B non sono legati uno-a-uno con punti in A . Questa è una cosa importante da tenere a mente quando si cerca l'adattamento migliore: il numero di punti in A e B non è necessariamente lo stesso e la bontà del test di adattamento dovrebbe anche tenere conto di questa discrepanza e cercare di minimizzarla.
2- Il numero di punti in ogni set di dati B (output del modello) che cerco di adattare ad A non è fisso.
Ho visto il test Chi-Squared usato in alcuni casi:
; dove O i
ma il problema è: cosa devo fare se è zero? Come puoi vedere nell'immagine sopra, se creo una griglia di quei diagrammi in quell'intervallo ci sarà
Inoltre, ho letto che alcune persone raccomandano a di applicare un test Poisson di verosimiglianza in casi come questo in cui sono coinvolti gli istogrammi. Se questo è corretto, lo apprezzerei molto se qualcuno potesse darmi istruzioni su come utilizzare quel test in questo caso particolare (ricorda, la mia conoscenza delle statistiche è piuttosto scarsa, quindi per favore mantienila il più semplice possibile :)