Come si verifica uno "stack overflow" e come si previene?


97

Come si verifica un overflow dello stack e quali sono i modi migliori per assicurarsi che non accada, o modi per prevenirlo, in particolare sui server web, ma sarebbero interessanti anche altri esempi?

Risposte:


126

Pila

Uno stack, in questo contesto, è l'ultimo buffer in entrata e in uscita in cui si inseriscono i dati durante l'esecuzione del programma. Last in, first out (LIFO) significa che l'ultima cosa che inserisci è sempre la prima cosa che esci di nuovo: se metti 2 elementi in pila, "A" e poi "B", la prima cosa che fai scoppiare fuori dallo stack sarà "B", e la prossima cosa è "A".

Quando si chiama una funzione nel codice, l'istruzione successiva dopo la chiamata di funzione viene archiviata nello stack e lo spazio di archiviazione che potrebbe essere sovrascritto dalla chiamata di funzione. La funzione che chiami potrebbe utilizzare più stack per le proprie variabili locali. Al termine, libera lo spazio di stack delle variabili locali utilizzato, quindi torna alla funzione precedente.

Stack overflow

Un overflow dello stack si verifica quando hai utilizzato più memoria per lo stack di quella che il tuo programma avrebbe dovuto usare. Nei sistemi embedded potresti avere solo 256 byte per lo stack, e se ogni funzione occupa 32 byte allora puoi avere solo 8 chiamate di funzione profonde - la funzione 1 chiama la funzione 2 chi chiama la funzione 3 chi chiama la funzione 4 .... chi chiama funzione 8 che chiama la funzione 9, ma la funzione 9 sovrascrive la memoria al di fuori dello stack. Questo potrebbe sovrascrivere la memoria, il codice, ecc.

Molti programmatori commettono questo errore chiamando la funzione A che poi chiama la funzione B, che poi chiama la funzione C, che poi chiama la funzione A. Potrebbe funzionare la maggior parte del tempo, ma solo una volta che l'input sbagliato lo farà rimanere in quel cerchio per sempre finché il computer non riconosce che lo stack è sovraccarico.

Anche le funzioni ricorsive sono una causa di ciò, ma se stai scrivendo in modo ricorsivo (cioè, la tua funzione chiama se stessa), devi esserne consapevole e utilizzare variabili statiche / globali per prevenire la ricorsione infinita.

In generale, il sistema operativo e il linguaggio di programmazione che stai utilizzando gestiscono lo stack ed è fuori dal tuo controllo. Dovresti guardare il tuo grafico delle chiamate (una struttura ad albero che mostra dal tuo principale ciò che ogni funzione chiama) per vedere quanto sono profonde le tue chiamate di funzione e per rilevare cicli e ricorsioni che non sono previsti. I cicli intenzionali e la ricorsione devono essere controllati artificialmente per escludere errori se si chiamano l'un l'altro troppe volte.

Oltre a buone pratiche di programmazione, test statici e dinamici, non c'è molto che puoi fare su questi sistemi di alto livello.

Sistemi integrati

Nel mondo embedded, specialmente nel codice ad alta affidabilità (automobilistico, aeronautico, spaziale), fai revisioni e controlli approfonditi del codice, ma fai anche quanto segue:

  • Non consentire ricorsione e cicli - imposto da criteri e test
  • Mantieni il codice e lo stack distanti (codice in flash, stack in RAM e mai i due si incontreranno)
  • Posiziona le fasce di guardia intorno alla pila - un'area vuota di memoria che riempi con un numero magico (di solito un'istruzione di interruzione del software, ma ci sono molte opzioni qui), e centinaia o migliaia di volte al secondo guardi le fasce di guardia per assicurarti non sono stati sovrascritti.
  • Usa la protezione della memoria (ovvero, nessuna esecuzione sullo stack, nessuna lettura o scrittura appena fuori dallo stack)
  • Gli interrupt non chiamano funzioni secondarie: impostano flag, copiano dati e lasciano che l'applicazione si occupi di elaborarli (altrimenti potresti ottenere 8 in profondità nell'albero delle chiamate di funzione, avere un interrupt e quindi uscire da altre poche funzioni all'interno del interrompere, provocando lo scoppio). Sono disponibili diversi alberi delle chiamate: uno per i processi principali e uno per ogni interrupt. Se le tue interruzioni possono interrompersi a vicenda ... beh, ci sono draghi ...

Linguaggi e sistemi di alto livello

Ma nei linguaggi di alto livello vengono eseguiti sui sistemi operativi:

  • Riduci l'archiviazione delle variabili locali (le variabili locali sono memorizzate nello stack, sebbene i compilatori siano piuttosto intelligenti su questo e a volte inseriranno grandi variabili locali nell'heap se il tuo albero delle chiamate è superficiale)
  • Evita o limita rigorosamente la ricorsione
  • Non suddividere i programmi in funzioni sempre più piccole, anche senza contare le variabili locali ogni chiamata di funzione consuma fino a 64 byte nello stack (processore a 32 bit, risparmiando metà dei registri, flag, ecc. Della CPU)
  • Mantieni il tuo albero delle chiamate poco profondo (simile alla dichiarazione sopra)

Server web

Dipende dalla 'sandbox' che hai se puoi controllare o anche vedere lo stack. È probabile che tu possa trattare i server web come faresti con qualsiasi altro linguaggio e sistema operativo di alto livello: è in gran parte fuori dalle tue mani, ma controlla la lingua e lo stack del server che stai utilizzando. Ad esempio, è possibile far saltare lo stack sul tuo server SQL.

-Adamo


8

Un overflow dello stack nel codice reale si verifica molto raramente. La maggior parte delle situazioni in cui si verifica sono ricorsioni in cui la terminazione è stata dimenticata. Potrebbe tuttavia verificarsi raramente in strutture altamente annidate, ad esempio documenti XML particolarmente grandi. L'unico vero aiuto qui è il refactoring del codice per utilizzare un oggetto stack esplicito invece dello stack di chiamate.


7

La maggior parte delle persone ti dirà che un overflow dello stack si verifica con la ricorsione senza un percorso di uscita, sebbene per lo più vero, se lavori con strutture dati sufficientemente grandi, anche un percorso di uscita ricorsivo appropriato non ti aiuterà.

Alcune opzioni in questo caso:


7

Uno stack overflow si verifica quando Jeff e Joel desiderano offrire al mondo un posto migliore per ottenere risposte a domande tecniche. È troppo tardi per impedire questo overflow dello stack. Quell'altro "sito" avrebbe potuto impedirlo non essendo sudicio. ;)


6

La ricorsione infinita è un modo comune per ottenere un errore di overflow dello stack. Per prevenire, assicurati sempre che ci sia un percorso di uscita che verrà colpito. :-)

Un altro modo per ottenere un overflow dello stack (almeno in C / C ++) è dichiarare qualche enorme variabile nello stack.

char hugeArray[100000000];

Questo lo farà.


Che lingua stai usando? In C, questo quasi sicuramente si tradurrà in un overflow dello stack. In C #, non sarà così perché l'array è allocato sull'heap e non sullo stack.Vedi questa domanda per un esempio di questo problema in pratica: stackoverflow.com/questions/571945/…
Matt Dillard,

4

Di solito uno stack overflow è il risultato di una chiamata ricorsiva infinita (data la consueta quantità di memoria nei computer standard oggigiorno).

Quando si effettua una chiamata a un metodo, una funzione o una procedura, il modo "standard" o effettuare la chiamata consiste in:

  1. Spingere la direzione di ritorno per la chiamata nello stack (questa è la frase successiva dopo la chiamata)
  2. Di solito lo spazio per il valore restituito viene riservato nello stack
  3. Inserimento di ogni parametro nello stack (l'ordine diverge e dipende da ogni compilatore, inoltre alcuni di essi vengono talvolta memorizzati nei registri della CPU per migliorare le prestazioni)
  4. Effettuare la chiamata vera e propria.

Quindi, di solito questo richiede pochi byte a seconda del numero e del tipo dei parametri e dell'architettura della macchina.

Vedrai allora che se inizi a fare chiamate ricorsive lo stack inizierà a crescere. Ora, lo stack è solitamente riservato in memoria in modo tale da crescere in direzione opposta all'heap, quindi, dato un gran numero di chiamate senza "tornare indietro", lo stack inizia a riempirsi.

Ora, in tempi più vecchi potrebbe verificarsi un overflow dello stack semplicemente perché hai esaurito tutta la memoria disponibile, proprio così. Con il modello di memoria virtuale (fino a 4 GB su un sistema X86) che era fuori dall'ambito, quindi di solito, se si verifica un errore di overflow dello stack, cercare una chiamata ricorsiva infinita.


4

Che cosa? Nessuno ha alcun amore per quelli ricoperti da un ciclo infinito?

do
{
  JeffAtwood.WritesCode();
} while(StackOverflow.MakingMadBank.Equals(false));

2
Questo è un loop infinito, non un overflow dello stack
Eddie Curtis

3

A parte la forma di overflow dello stack che si ottiene da una ricorsione diretta (ad esempio Fibonacci(1000000)), una forma più sottile di essa che ho sperimentato molte volte è una ricorsione indiretta, in cui una funzione chiama un'altra funzione, che ne chiama un'altra, e poi una di quelle funzioni richiamano di nuovo la prima.

Ciò può accadere comunemente nelle funzioni che vengono chiamate in risposta ad eventi ma che a loro volta possono generare nuovi eventi, ad esempio:

void WindowSizeChanged(Size& newsize) {
  // override window size to constrain width
    newSize.width=200;
    ResizeWindow(newSize);
}

In questo caso, la chiamata a ResizeWindowpuò causare il WindowSizeChanged()riavvio del callback, che chiama di ResizeWindownuovo, finché non si esaurisce lo stack. In situazioni come queste è spesso necessario posticipare la risposta all'evento fino a quando lo stack frame non è tornato, ad esempio inviando un messaggio.


2

Considerando che questo è stato contrassegnato con "hacking", sospetto che lo "stack overflow" a cui si riferisce sia un overflow dello stack di chiamate, piuttosto che un overflow dello stack di livello superiore come quelli a cui si fa riferimento nella maggior parte delle altre risposte qui. In realtà non si applica a nessun ambiente gestito o interpretato come .NET, Java, Python, Perl, PHP, ecc., In cui sono tipicamente scritte le app Web, quindi l'unico rischio è il server Web stesso, che probabilmente è scritto in C o C ++.

Dai un'occhiata a questo thread:

/programming/7308/what-is-a-good-starting-point-for-learning-buffer-overflow


1

Ho ricreato il problema di overflow dello stack ottenendo un numero di Fibonacci più comune, ad esempio 1, 1, 2, 3, 5 ..... quindi il calcolo per fib (1) = 1 o fib (3) = 2 .. fib (n ) = ??.

per n, diciamo che saremo interessati - e se n = 100.000, quale sarà il numero di Fibonacci corrispondente ??

L'approccio a un ciclo è il seguente:

package com.company.dynamicProgramming;

import java.math.BigInteger;

public class FibonacciByBigDecimal {

    public static void main(String ...args) {

        int n = 100000;
        BigInteger[] fibOfnS = new BigInteger[n + 1];

        System.out.println("fibonacci of "+ n + " is : " + fibByLoop(n));
    }


    static BigInteger fibByLoop(int n){

        if(n==1 || n==2 ){
            return BigInteger.ONE;
        }

        BigInteger fib = BigInteger.ONE;
        BigInteger fip = BigInteger.ONE;


        for (int i = 3; i <= n; i++){

            BigInteger p = fib;
            fib = fib.add(fip);
            fip = p;
        }

        return fib;
    }

}

questo è abbastanza semplice e il risultato è:

fibonacci of 100000 is : 

Ora un altro approccio che ho applicato è attraverso Divide and Concur tramite la ricorsione

cioè Fib (n) = fib (n-1) + Fib (n-2) e quindi ulteriore ricorsione per n-1 & n-2 ..... fino a 2 & 1. che è programmato come -

package com.company.dynamicProgramming;

import java.math.BigInteger;

public class FibonacciByBigDecimal {

    public static void main(String ...args) {

        int n = 100000;
        BigInteger[] fibOfnS = new BigInteger[n + 1];

        System.out.println("fibonacci of "+ n + " is : " + fibByDivCon(n, fibOfnS));

    }


    static BigInteger fibByDivCon(int n, BigInteger[] fibOfnS){

        if(fibOfnS[n]!=null){
            return fibOfnS[n];
        }

        if (n == 1 || n== 2){
            fibOfnS[n] = BigInteger.ONE;
            return BigInteger.ONE;
        }

        // creates 2 further entries in stack
        BigInteger fibOfn = fibByDivCon(n-1, fibOfnS).add( fibByDivCon(n-2, fibOfnS)) ;

        fibOfnS[n] = fibOfn;

        return fibOfn;

    }

}

Quando ho eseguito il codice per n = 100.000, il risultato è il seguente:

Exception in thread "main" java.lang.StackOverflowError
    at com.company.dynamicProgramming.FibonacciByBigDecimal.fibByDivCon(FibonacciByBigDecimal.java:29)
    at com.company.dynamicProgramming.FibonacciByBigDecimal.fibByDivCon(FibonacciByBigDecimal.java:29)
    at com.company.dynamicProgramming.FibonacciByBigDecimal.fibByDivCon(FibonacciByBigDecimal.java:29)

Sopra puoi vedere che StackOverflowError è stato creato. Ora la ragione di ciò è troppa ricorsione in quanto -

        // creates 2 further entries in stack
        BigInteger fibOfn = fibByDivCon(n-1, fibOfnS).add( fibByDivCon(n-2, fibOfnS)) ;

Quindi ogni voce nello stack crea altre 2 voci e così via ... che è rappresentata come -

inserisci qui la descrizione dell'immagine

Alla fine verranno create così tante voci che il sistema non è in grado di gestire nello stack e viene generato StackOverflowError.

Per la prevenzione: Per la prospettiva di esempio sopra - 1. Evita di usare l'approccio della ricorsione o riduci / limita la ricorsione di nuovo una divisione di un livello come se n è troppo grande, quindi dividi la n in modo che il sistema possa gestire il suo limite. 2. Utilizzare un altro approccio, come l'approccio del ciclo che ho utilizzato nel primo esempio di codice. (Non intendo affatto degradare Divide & Concur o Recursion in quanto sono approcci leggendari in molti algoritmi più famosi .. la mia intenzione è di limitare o stare lontano dalla ricorsione se sospetto problemi di overflow dello stack)

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.