La matematica della sicurezza informatica e le bande di previsione delle curve adattate dalla regressione non lineare sono spiegate in questa pagina con convalida incrociata. Mostra che le bande non sono sempre / di solito simmetriche.
Ed ecco una spiegazione con più parole e meno matematica:
Per prima cosa, definiamo G | x, che è il gradiente dei parametri con un valore particolare di X e usando tutti i valori più adatti dei parametri. Il risultato è un vettore, con un elemento per parametro. Per ogni parametro, è definito come dY / dP, dove Y è il valore Y della curva dato il particolare valore di X e tutti i valori dei parametri più adatti, e P è uno dei parametri.)
G '| x è quel vettore gradiente trasposto, quindi è una colonna anziché una riga di valori. Cov è la matrice di covarianza (inversa Assia dall'ultima iterazione). È una matrice quadrata con il numero di righe e colonne pari al numero di parametri. Ogni elemento nella matrice è la covarianza tra due parametri. Usiamo Cov per riferirci alla matrice di covarianza normalizzata , dove ogni valore è compreso tra -1 e 1.
Ora calcola
c = G '| x * Cov * G | x.
Il risultato è un singolo numero per qualsiasi valore di X.
Le bande di confidenza e previsione sono centrate sulla curva di adattamento migliore e si estendono sopra e sotto la curva di una quantità uguale.
Le bande di confidenza si estendono sopra e sotto la curva di:
= sqrt (c) * sqrt (SS / DF) * CriticalT (% di confidenza, DF)
Le bande di previsione estendono un'ulteriore distanza sopra e sotto la curva, pari a:
= sqrt (c + 1) * sqrt (SS / DF) * CriticalT (Fiducia%, DF)
In entrambe queste equazioni, il valore di c (definito sopra) dipende dal valore di X, quindi le bande di confidenza e previsione non sono una distanza costante dalla curva. Il valore di SS è la somma dei quadrati per l'adattamento e DF è il numero di gradi di libertà (numero di punti dati meno numero di parametri). CriticalT è una costante della distribuzione t in base al livello di confidenza desiderato (tradizionalmente 95%) e al numero di gradi di libertà. Per limiti del 95% e un df abbastanza grande, questo valore è vicino a 1,96. Se DF è piccolo, questo valore è più alto.