Qual è la funzione delle istruzioni push / pop usate sui registri nell'assembly x86?

Question 1

Quando leggo di assembler mi imbatto spesso in persone che scrivono che spingono un certo registro del processore e lo pop di nuovo in seguito per ripristinarne lo stato precedente.

Come puoi spingere un registro? Dove viene spinto? Perché è necessario?
Questo si riduce a una singola istruzione del processore o è più complesso?

Question 2

spingere un valore (non necessariamente memorizzato in un registro) significa scriverlo nello stack.

popping significa ripristinare in un registro tutto ciò che si trova in cima alla pila . Queste sono istruzioni di base:

push 0xdeadbeef      ; push a value to the stack
pop eax              ; eax is now 0xdeadbeef

; swap contents of registers
push eax
mov eax, ebx
pop ebx

Question 3

Ecco come spingere un registro. Presumo che stiamo parlando di x86.

push ebx
push eax

Viene messo in pila. Il valore di ESPregister viene decrementato alla dimensione del valore inserito quando lo stack cresce verso il basso nei sistemi x86.

Serve per preservare i valori. L'utilizzo generale è

push eax           ;   preserve the value of eax
call some_method   ;   some method is called which will put return value in eax
mov  edx, eax      ;    move the return value to edx
pop  eax           ;    restore original eax

A pushè una singola istruzione in x86, che fa due cose internamente.

Decrementa il ESPregistro della dimensione del valore inserito.
Memorizza il valore premuto all'indirizzo corrente del ESPregistro.

Question 4

Dove viene spinto?

esp - 4. Più precisamente:

esp viene sottratto per 4
il valore viene spinto a esp

pop inverte questo.

L'ABI di System V dice a Linux di rsppuntare a una posizione dello stack ragionevole quando il programma inizia a funzionare: Qual è lo stato del registro predefinito all'avvio del programma (asm, linux)? che è quello che dovresti usare di solito.

Come puoi spingere un registro?

Esempio minimo GNU GAS:

.data
    /* .long takes 4 bytes each. */
    val1:
        /* Store bytes 0x 01 00 00 00 here. */
        .long 1
    val2:
        /* 0x 02 00 00 00 */
        .long 2
.text
    /* Make esp point to the address of val2.
     * Unusual, but totally possible. */
    mov $val2, %esp

    /* eax = 3 */
    mov $3, %ea 

    push %eax
    /*
    Outcome:
    - esp == val1
    - val1 == 3
    esp was changed to point to val1,
    and then val1 was modified.
    */

    pop %ebx
    /*
    Outcome:
    - esp == &val2
    - ebx == 3
    Inverses push: ebx gets the value of val1 (first)
    and then esp is increased back to point to val2.
    */

Quanto sopra su GitHub con asserzioni eseguibili .

Perché è necessario?

È vero che queste istruzioni potrebbero essere facilmente implementate tramite mov, adde sub.

La ragione per cui esistono, è che quelle combinazioni di istruzioni sono così frequenti che Intel ha deciso di fornirle per noi.

Il motivo per cui queste combinazioni sono così frequenti è che facilitano il salvataggio e il ripristino temporaneo dei valori dei registri in memoria in modo che non vengano sovrascritti.

Per capire il problema, prova a compilare manualmente un po 'di codice C.

Una delle difficoltà maggiori è decidere dove memorizzare ogni variabile.

Idealmente, tutte le variabili si adatterebbero ai registri, che è la memoria più veloce a cui accedere (attualmente circa 100 volte più veloce della RAM).

Ma ovviamente, possiamo facilmente avere più variabili che registri, specialmente per gli argomenti delle funzioni annidate, quindi l'unica soluzione è scrivere in memoria.

Potremmo scrivere in qualsiasi indirizzo di memoria, ma poiché le variabili locali e gli argomenti delle chiamate e dei ritorni di funzione rientrano in un bel pattern di stack, che impedisce la frammentazione della memoria , questo è il modo migliore per gestirlo. Confrontalo con la follia di scrivere un allocatore di heap.

Quindi lasciamo che i compilatori ottimizzino l'allocazione dei registri per noi, poiché questo è NP completo e una delle parti più difficili della scrittura di un compilatore. Questo problema è chiamato allocazione dei registri ed è isomorfo alla colorazione del grafico .

Quando l'allocatore del compilatore è costretto a memorizzare le cose in memoria invece che solo nei registri, ciò è noto come fuoriuscita .

Questo si riduce a una singola istruzione del processore o è più complesso?

Tutto quello che sappiamo per certo è che Intel documenta un'istruzione pushe popun'istruzione, quindi sono un'istruzione in questo senso.

Internamente, potrebbe essere espanso a più microcodici, uno da modificare espe uno per eseguire l'IO della memoria e richiedere più cicli.

Ma è anche possibile che una singola pushsia più veloce di una combinazione equivalente di altre istruzioni, poiché è più specifica.

Questo è per lo più sotto (der) documentato:

Peter Cordes menziona che le tecniche descritte su http://agner.org/optimize/microarchitecture.pdf lo suggeriscono pushe popprendono una singola micro operazione.
Johan afferma che, poiché il Pentium M Intel utilizza un "motore stack", che memorizza i valori esp + regsize ed esp-regsize precalcolati, consentendo l'esecuzione di push e pop in un unico uop. Citato anche su: https://en.wikipedia.org/wiki/Stack_register
Cos'è il microcodice Intel?
/security/29730/processor-microcode-manipulation-to-change-opcodes
Quanti cicli di CPU sono necessari per ogni istruzione di assemblaggio?

Question 5

I registri push e popping sono dietro le quinte equivalenti a questo:

push reg   <= same as =>      sub  $8,%rsp        # subtract 8 from rsp
                              mov  reg,(%rsp)     # store, using rsp as the address

pop  reg    <= same as=>      mov  (%rsp),reg     # load, using rsp as the address
                              add  $8,%rsp        # add 8 to the rsp

Nota che questa è la sintassi At & t x86-64.

Utilizzato in coppia, consente di salvare un registro nello stack e ripristinarlo in un secondo momento. Ci sono anche altri usi.

Question 6

Quasi tutte le CPU utilizzano lo stack. Lo stack del programma è la tecnica LIFO con gestione supportata dall'hardware.

Lo stack è la quantità di memoria del programma (RAM) normalmente allocata nella parte superiore dell'heap di memoria della CPU e cresce (all'istruzione PUSH il puntatore dello stack viene diminuito) nella direzione opposta. Un termine standard per l'inserimento nello stack è PUSH e per rimuovere dallo stack è POP .

Lo stack è gestito tramite il registro della CPU previsto dallo stack , chiamato anche stack pointer, quindi quando la CPU esegue POP o PUSH il puntatore dello stack caricherà / memorizzerà un registro o una costante nella memoria dello stack e il puntatore dello stack verrà automaticamente diminuito xo aumentato in base al numero di parole spinte o inserito in (da) stack.

Tramite le istruzioni dell'assemblatore possiamo memorizzare per impilare:

Registri della CPU e anche costanti.
Indirizzi di ritorno per funzioni o procedure
Funzioni / procedure in / out variabili
Funzioni / procedure variabili locali.