Attualmente sto sviluppando un'istanza su EC2 su cui importare l'intera istantanea Planet.osm dei dati dell'intera Terra per alcuni progetti su cui stiamo lavorando. Ho creato una grande istanza di Ubuntu x64 e ho collegato un sacco di spazio di archiviazione separato su un volume EBS per il database Postgres e l'ho modificato per ospitare lì i dati PGSQL.
Ora il server sta riscontrando problemi nell'utilizzare osm2pgsql
l'importazione dell'istantanea ... Dopo un paio di tentativi con configurazioni di memoria diverse e quant'altro, il processo continua a produrre "Killed" dopo aver attraversato quasi tutto il percorso; una volta è stato ucciso mentre "esaminava i modi in sospeso" e la volta successiva, dopo aver leggermente modificato la cache sottile, ha raggiunto i "modi di elaborazione" prima di schiantarsi. Da quello che ho letto, questo è generalmente dovuto a problemi di memoria.
Ecco il mio ultimo tentativo di eseguire l'importazione:
osm2pgsql -v -U osm -s -C 4096 -S default.style -d osm /data/osm/planet-latest.osm.bz2
Ed ecco le specifiche per un'istanza di grandi dimensioni su EC2:
Grande istanza 7,5 GB di memoria, 4 unità di calcolo EC2 (2 core virtuali con 2 unità di calcolo EC2 ciascuna), 850 GB di memoria di istanza locale, piattaforma a 64 bit
La mia domanda è: ci sono alcune buone risorse di benchmark per determinare i requisiti di ottimizzazione per osm2pgsql e Postgres? La velocità di importazione non è nemmeno così importante per me, vorrei solo essere in grado di assicurarmi che il processo si completasse in modo sicuro, anche se ci vogliono 4 o 5 giorni ... Ho letto attraverso "L' ottimizzazione del rendering di Frederick Ramm catena "(PDF) documento dal SOTM dell'anno scorso, ma ci sono altre buone opinioni / risorse?