L'indirizzo iniziale è l'indirizzo di main()
, giusto?
Non proprio: l'inizio di un programma non è proprio main()
. Per impostazione predefinita, GCC produrrà eseguibili il cui indirizzo iniziale corrisponde al _start
simbolo. Puoi vederlo facendo un objdump --disassemble Q1
. Ecco l'output di un mio semplice programma che funziona solo return 0;
in main()
:
0000000000400e30 <_start>:
400e30: 31 ed xor %ebp,%ebp
400e32: 49 89 d1 mov %rdx,%r9
400e35: 5e pop %rsi
400e36: 48 89 e2 mov %rsp,%rdx
400e39: 48 83 e4 f0 and $0xfffffffffffffff0,%rsp
400e3d: 50 push %rax
400e3e: 54 push %rsp
400e3f: 49 c7 c0 a0 15 40 00 mov $0x4015a0,%r8
400e46: 48 c7 c1 10 15 40 00 mov $0x401510,%rcx
400e4d: 48 c7 c7 40 0f 40 00 mov $0x400f40,%rdi
400e54: e8 f7 00 00 00 callq 400f50 <__libc_start_main>
400e59: f4 hlt
400e5a: 66 90 xchg %ax,%ax
400e5c: 0f 1f 40 00 nopl 0x0(%rax)
Come puoi vedere all'indirizzo 400e54
, _start()
a sua volta invoca __libc_start_main
, che inizializza le cose necessarie (pthreads, atexit, ...) e infine chiama main()
con gli argomenti appropriati (argc, argv e env).
Okay, ma cosa c'entra con il cambio dell'indirizzo iniziale?
Quando chiedi gcc
di collegarti staticamente, significa che tutte le inizializzazioni che ho menzionato sopra devono essere fatte usando funzioni che sono nell'eseguibile. E infatti se guardi le dimensioni di entrambi gli eseguibili, scoprirai che la versione statica è molto più grande. Nel mio test, la versione statica è 800K mentre la versione condivisa è solo 6K.
Le funzioni extra si trovano prima _start()
, quindi la modifica dell'indirizzo iniziale. Ecco il layout dell'eseguibile statico in giro start()
:
000000000049e960 r translit_from_tbl
0000000000400a76 t _i18n_number_rewrite
0000000000400bc0 t fini
0000000000400bd0 t init_cacheinfo
0000000000400e30 T _start
0000000000400e60 t deregister_tm_clones
0000000000400e90 t register_tm_clones
0000000000400ed0 t __do_global_dtors_aux
Ed ecco il layout dell'eseguibile condiviso:
00000000004003c0 T _start
00000000004003f0 t deregister_tm_clones
00000000004004b0 T main
00000000004004c0 T __libc_csu_init
00000000006008a0 B _end
0000000000400370 T _init
Di conseguenza, ottengo indirizzi iniziali leggermente diversi: 0x400e30 nel caso statico e 0x4003c0 nel caso condiviso.