objdump
+ gdb
esempio minimo eseguibile
TL; DR:
Ora per la configurazione completa del test educativo:
main.c
#include <stddef.h>
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
int myfunc(int i) {
*(int*)(NULL) = i; /* line 7 */
return i - 1;
}
int main(int argc, char **argv) {
/* Setup some memory. */
char data_ptr[] = "string in data segment";
char *mmap_ptr;
char *text_ptr = "string in text segment";
(void)argv;
mmap_ptr = (char *)malloc(sizeof(data_ptr) + 1);
strcpy(mmap_ptr, data_ptr);
mmap_ptr[10] = 'm';
mmap_ptr[11] = 'm';
mmap_ptr[12] = 'a';
mmap_ptr[13] = 'p';
printf("text addr: %p\n", text_ptr);
printf("data addr: %p\n", data_ptr);
printf("mmap addr: %p\n", mmap_ptr);
/* Call a function to prepare a stack trace. */
return myfunc(argc);
}
Compila ed esegui per generare core:
gcc -ggdb3 -std=c99 -Wall -Wextra -pedantic -o main.out main.c
ulimit -c unlimited
rm -f core
./main.out
Produzione:
text addr: 0x4007d4
data addr: 0x7ffec6739220
mmap addr: 0x1612010
Segmentation fault (core dumped)
GDB ci indica la linea esatta in cui si è verificato l'errore di segmentazione, che è ciò che la maggior parte degli utenti desidera durante il debug:
gdb -q -nh main.out core
poi:
Reading symbols from main.out...done.
[New LWP 27479]
Core was generated by `./main.out'.
Program terminated with signal SIGSEGV, Segmentation fault.
#0 0x0000000000400635 in myfunc (i=1) at main.c:7
7 *(int*)(NULL) = i;
(gdb) bt
#0 0x0000000000400635 in myfunc (i=1) at main.c:7
#1 0x000000000040072b in main (argc=1, argv=0x7ffec6739328) at main.c:28
che ci indica direttamente la buggy line 7.
Gli argomenti della CLI sono memorizzati nel file principale e non è necessario passarli di nuovo
Per rispondere alle domande specifiche dell'argomento CLI, vediamo che se cambiamo gli argomenti cli, ad esempio con:
rm -f core
./main.out 1 2
quindi questo si riflette nella bactrace precedente senza alcuna modifica nei nostri comandi:
Reading symbols from main.out...done.
[New LWP 21838]
Core was generated by `./main.out 1 2'.
Program terminated with signal SIGSEGV, Segmentation fault.
#0 0x0000564583cf2759 in myfunc (i=3) at main.c:7
7 *(int*)(NULL) = i; /* line 7 */
(gdb) bt
#0 0x0000564583cf2759 in myfunc (i=3) at main.c:7
#1 0x0000564583cf2858 in main (argc=3, argv=0x7ffcca4effa8) at main.c:2
Quindi nota come ora argc=3
. Pertanto, ciò deve significare che il file core memorizza tali informazioni. Immagino che lo memorizzi solo come argomenti dimain
, proprio come memorizza gli argomenti di qualsiasi altra funzione.
Questo ha senso se si considera che il core dump deve archiviare l'intera memoria e registrare lo stato del programma, e quindi ha tutte le informazioni necessarie per determinare il valore degli argomenti della funzione nello stack corrente.
Meno ovvio è come controllare le variabili d'ambiente: Come ottenere variabili d'ambiente da un dump principale Le variabili d'ambiente sono presenti anche nella memoria, quindi l'objdump contiene tali informazioni, ma non sono sicuro di come elencarle tutte in una sola volta comodamente , uno per uno come segue ha funzionato nei miei test:
p __environ[0]
Analisi di binutils
Usando strumenti binutils come readelf
e objdump
, possiamo eseguire il dump di massa delle informazioni contenute nel core
file come lo stato della memoria.
La maggior parte / tutto deve anche essere visibile tramite GDB, ma quegli strumenti binutils offrono un approccio più voluminoso che è conveniente per alcuni casi d'uso, mentre GDB è più conveniente per un'esplorazione più interattiva.
Primo:
file core
ci dice che il core
file è in realtà un file ELF :
core: ELF 64-bit LSB core file x86-64, version 1 (SYSV), SVR4-style, from './main.out'
ecco perché siamo in grado di ispezionarlo più direttamente con i soliti strumenti binutils.
Un rapido sguardo allo standard ELF mostra che in realtà esiste un tipo ELF ad esso dedicato:
Elf32_Ehd.e_type == ET_CORE
Ulteriori informazioni sul formato sono disponibili all'indirizzo:
man 5 core
Poi:
readelf -Wa core
fornisce alcuni suggerimenti sulla struttura del file. La memoria sembra essere contenuta nelle normali intestazioni del programma:
Program Headers:
Type Offset VirtAddr PhysAddr FileSiz MemSiz Flg Align
NOTE 0x000468 0x0000000000000000 0x0000000000000000 0x000b9c 0x000000 0
LOAD 0x002000 0x0000000000400000 0x0000000000000000 0x001000 0x001000 R E 0x1000
LOAD 0x003000 0x0000000000600000 0x0000000000000000 0x001000 0x001000 R 0x1000
LOAD 0x004000 0x0000000000601000 0x0000000000000000 0x001000 0x001000 RW 0x1000
e ci sono altri metadati presenti nell'area delle note, in particolare prstatus
contiene il PC :
Displaying notes found at file offset 0x00000468 with length 0x00000b9c:
Owner Data size Description
CORE 0x00000150 NT_PRSTATUS (prstatus structure)
CORE 0x00000088 NT_PRPSINFO (prpsinfo structure)
CORE 0x00000080 NT_SIGINFO (siginfo_t data)
CORE 0x00000130 NT_AUXV (auxiliary vector)
CORE 0x00000246 NT_FILE (mapped files)
Page size: 4096
Start End Page Offset
0x0000000000400000 0x0000000000401000 0x0000000000000000
/home/ciro/test/main.out
0x0000000000600000 0x0000000000601000 0x0000000000000000
/home/ciro/test/main.out
0x0000000000601000 0x0000000000602000 0x0000000000000001
/home/ciro/test/main.out
0x00007f8d939ee000 0x00007f8d93bae000 0x0000000000000000
/lib/x86_64-linux-gnu/libc-2.23.so
0x00007f8d93bae000 0x00007f8d93dae000 0x00000000000001c0
/lib/x86_64-linux-gnu/libc-2.23.so
0x00007f8d93dae000 0x00007f8d93db2000 0x00000000000001c0
/lib/x86_64-linux-gnu/libc-2.23.so
0x00007f8d93db2000 0x00007f8d93db4000 0x00000000000001c4
/lib/x86_64-linux-gnu/libc-2.23.so
0x00007f8d93db8000 0x00007f8d93dde000 0x0000000000000000
/lib/x86_64-linux-gnu/ld-2.23.so
0x00007f8d93fdd000 0x00007f8d93fde000 0x0000000000000025
/lib/x86_64-linux-gnu/ld-2.23.so
0x00007f8d93fde000 0x00007f8d93fdf000 0x0000000000000026
/lib/x86_64-linux-gnu/ld-2.23.so
CORE 0x00000200 NT_FPREGSET (floating point registers)
LINUX 0x00000340 NT_X86_XSTATE (x86 XSAVE extended state)
objdump
può scaricare facilmente tutta la memoria con:
objdump -s core
che contiene:
Contents of section load1:
4007d0 01000200 73747269 6e672069 6e207465 ....string in te
4007e0 78742073 65676d65 6e740074 65787420 xt segment.text
Contents of section load15:
7ffec6739220 73747269 6e672069 6e206461 74612073 string in data s
7ffec6739230 65676d65 6e740000 00a8677b 9c6778cd egment....g{.gx.
Contents of section load4:
1612010 73747269 6e672069 6e206d6d 61702073 string in mmap s
1612020 65676d65 6e740000 11040000 00000000 egment..........
che corrisponde esattamente al valore stdout nella nostra corsa.
Questo è stato testato su Ubuntu 16.04 amd64, GCC 6.4.0 e binutils 2.26.1.
exe
non sia uno script di shell (per impostare alcune variabili, ecc.) Come ad esempiofirefox
su Linux?