Parlare del 99 % dei punti in un ipercubo ' è un po 'fuorviante poiché un ipercubo contiene infiniti punti. Parliamo invece di volume.
Il volume di un ipercubo è il prodotto delle sue lunghezze laterali. Per l'ipercubo dell'unità 50-dimensionale otteniamo Volume totale = 1 × 1 × ⋯ × 150 volte= 150= 1
Ora escludiamo i confini dell'ipercubo e guardiamo "l' interno " (lo metto tra virgolette perché il termine matematico interno ha un significato molto diverso). Manteniamo solo i punti x = ( x1, x2, ... , x50) che soddisfano
0,05 < x1< 0,95 e 0,05 < x2< 0,95 e ... e 0,05 < x50< 0,95.
Qual è il volume di questo "interno"? Bene, "l'interno" è di nuovo un ipercubo e la lunghezza di ciascun lato è0.9 (= 0,95 - 0,05 ... aiuta a immaginarlo in due e tre dimensioni). Quindi il volume è VolumeVolume interno = 0.9 × 0.9 × ⋯ × 0.950 volte= 0.950≈ 0,005.
Concludere che il volume del "limite" (definito come ipercubo unitario senza "interno ') è 1 - 0,950≈ 0.995.
Ciò dimostra che il 99,5 % del volume di un ipercubo a 50 dimensioni è concentrato sul suo " confine ".
Follow-up: Ignatius ha sollevato un'interessante domanda su come ciò sia collegato alla probabilità. Ecco un esempio
Supponiamo che tu abbia ideato un modello (di apprendimento automatico) che prevede i prezzi delle abitazioni in base a 50 parametri di input. Tutti i 50 parametri di input sono indipendenti e distribuiti uniformemente tra 0 e 1 .
Diciamo che il tuo modello funziona molto bene se nessuno dei parametri di input è estremo: fintanto che ogni parametro di input rimane tra 0.05 e 0.95 , il tuo modello prevede il prezzo dell'alloggio quasi perfettamente. Ma se uno o più parametri di input sono estremi (inferiori a 0.05 o superiori a 0.95 ), le previsioni del modello sono assolutamente terribili.
Ogni dato parametro di input è estremo con una probabilità del solo 10 % . Quindi chiaramente questo è un buon modello, giusto? No! La probabilità che almeno uno dei 50 parametri sia estrema è 1 - 0,950≈ 0.995.
Quindi, nel 99,5 % dei casi, la previsione del tuo modello è terribile.
Regola empirica: in dimensioni elevate, le osservazioni estreme sono la regola e non l'eccezione.