Effetto del collegamento statico e dinamico sull'indirizzo iniziale


8

Ho un semplice programma C. Io corro:

$ gcc Q1.c -Wall -save-temps -o Q1

Quindi controllo l'eseguibile generato:

$  objdump -f Q1
Q1:     file format elf32-i386
architecture: i386, flags 0x00000112:
EXEC_P, HAS_SYMS, D_PAGED
start address 0x080483b0

Quindi lo compilo con link statici:

$ gcc Q1.c -Wall -save-temps -static -o Q1

e ispezionare nuovamente il file:

$ objdump -f Q1
Q1:     file format elf32-i386
architecture: i386, flags 0x00000112:
EXEC_P, HAS_SYMS, D_PAGED
start address 0x08048e08

Che effetto hanno i collegamenti statici e dinamici sull'indirizzo iniziale del programma? L'indirizzo iniziale è l'indirizzo di main(), giusto?

Risposte:


10

L'indirizzo iniziale è l'indirizzo di main(), giusto?

Non proprio: l'inizio di un programma non è proprio main(). Per impostazione predefinita, GCC produrrà eseguibili il cui indirizzo iniziale corrisponde al _startsimbolo. Puoi vederlo facendo un objdump --disassemble Q1. Ecco l'output di un mio semplice programma che funziona solo return 0;in main():

0000000000400e30 <_start>:
  400e30:       31 ed                   xor    %ebp,%ebp
  400e32:       49 89 d1                mov    %rdx,%r9
  400e35:       5e                      pop    %rsi
  400e36:       48 89 e2                mov    %rsp,%rdx
  400e39:       48 83 e4 f0             and    $0xfffffffffffffff0,%rsp
  400e3d:       50                      push   %rax
  400e3e:       54                      push   %rsp
  400e3f:       49 c7 c0 a0 15 40 00    mov    $0x4015a0,%r8
  400e46:       48 c7 c1 10 15 40 00    mov    $0x401510,%rcx
  400e4d:       48 c7 c7 40 0f 40 00    mov    $0x400f40,%rdi
  400e54:       e8 f7 00 00 00          callq  400f50 <__libc_start_main>
  400e59:       f4                      hlt    
  400e5a:       66 90                   xchg   %ax,%ax
  400e5c:       0f 1f 40 00             nopl   0x0(%rax)

Come puoi vedere all'indirizzo 400e54, _start()a sua volta invoca __libc_start_main, che inizializza le cose necessarie (pthreads, atexit, ...) e infine chiama main()con gli argomenti appropriati (argc, argv e env).

Okay, ma cosa c'entra con il cambio dell'indirizzo iniziale?

Quando chiedi gccdi collegarti staticamente, significa che tutte le inizializzazioni che ho menzionato sopra devono essere fatte usando funzioni che sono nell'eseguibile. E infatti se guardi le dimensioni di entrambi gli eseguibili, scoprirai che la versione statica è molto più grande. Nel mio test, la versione statica è 800K mentre la versione condivisa è solo 6K.

Le funzioni extra si trovano prima _start(), quindi la modifica dell'indirizzo iniziale. Ecco il layout dell'eseguibile statico in giro start():

000000000049e960 r translit_from_tbl
0000000000400a76 t _i18n_number_rewrite
0000000000400bc0 t fini
0000000000400bd0 t init_cacheinfo
0000000000400e30 T _start
0000000000400e60 t deregister_tm_clones
0000000000400e90 t register_tm_clones
0000000000400ed0 t __do_global_dtors_aux

Ed ecco il layout dell'eseguibile condiviso:

00000000004003c0 T _start
00000000004003f0 t deregister_tm_clones
00000000004004b0 T main
00000000004004c0 T __libc_csu_init
00000000006008a0 B _end
0000000000400370 T _init

Di conseguenza, ottengo indirizzi iniziali leggermente diversi: 0x400e30 nel caso statico e 0x4003c0 nel caso condiviso.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.