VUOTO che restituisce spazio su disco al sistema operativo

VACUUMdi solito non restituisce spazio su disco al sistema operativo, tranne in alcuni casi speciali.
Dai documenti:

La forma standard VACUUMrimuove le versioni delle righe morte nelle tabelle e negli indici e indica lo spazio disponibile per il riutilizzo futuro. Tuttavia, non restituirà lo spazio al sistema operativo, tranne nel caso speciale in cui una o più pagine alla fine di una tabella diventano completamente libere e un blocco esclusivo delle tabelle può essere facilmente ottenuto. Al contrario, VACUUM FULLcompatta attivamente le tabelle scrivendo una nuova versione completa del file della tabella senza spazio morto. Ciò riduce al minimo le dimensioni della tabella, ma può richiedere molto tempo. Richiede inoltre spazio su disco aggiuntivo per la nuova copia della tabella, fino al completamento dell'operazione.

La domanda è: come può questo database indicare quando può one or more pages at the end of a table become entirely freeessere raggiunto? Questo può essere fatto tramite VACUUM FULL, ma non ho abbastanza spazio per implementarlo. Quindi ci sono altre possibilità?

— sbagliato-about-tutto
fonte

Per restituire spazio al sistema operativo, utilizzare VACUUM FULL. Pur essendo lì, suppongo che tu corra VACUUM FULL ANALYZE. Cito il manuale :

FULL

Seleziona il vuoto "completo", che può recuperare più spazio , ma richiede molto più tempo e blocca esclusivamente il tavolo. Questo metodo richiede anche spazio su disco aggiuntivo, poiché scrive una nuova copia della tabella e non rilascia la vecchia copia fino al completamento dell'operazione. Di solito questo dovrebbe essere usato solo quando è necessario recuperare una quantità significativa di spazio all'interno della tabella.

Enorme enfasi sulla mia.

CLUSTER raggiunge anche questo come effetto collaterale.

Plain VACUUMnormalmente non raggiungere il tuo obiettivo ( "una o più pagine alla fine di un tavolo completamente liberi" ). Non riordina le righe e elimina solo le pagine vuote dalla fine fisica del file quando si presenta l'opportunità, come indica la tua citazione dal manuale.

Puoi ottenere pagine vuote alla fine del file fisico quando fai INSERTun batch di righe e DELETEprima che vengano aggiunte altre tuple. Oppure può succedere per coincidenza se vengono eliminate abbastanza righe.

Ci sono anche impostazioni speciali che potrebbero impedire VACUUM FULLdi recuperare spazio. Vedere:

Come ottimizzare una tabella per aggiornamenti ad altissima frequenza?

Preparare le pagine vuote alla fine di una tabella per il test

La colonna di sistema ctidrappresenta la posizione fisica di una riga. Devi capire quella colonna:

Come posso scomporre ctid in numeri di pagina e di riga?

Possiamo lavorare con questo e preparare una tabella eliminando tutte le righe dall'ultima pagina:

DELETE FROM tbl t
USING (
   SELECT (split_part(ctid::text, ',', 1) || ',0)')::tid     AS min_tid
        , (split_part(ctid::text, ',', 1) || ',65535)')::tid AS max_tid
   FROM   tbl
   ORDER  BY ctid DESC
   LIMIT  1
   ) d
WHERE t.ctid BETWEEN d.min_tid AND d.max_tid;

Ora, l'ultima pagina è vuota. Ciò ignora le scritture simultanee. O sei l'unico a scrivere su quel tavolo o devi prendere un blocco di scrittura per evitare interferenze.

La query è ottimizzata per identificare rapidamente le righe qualificanti. Il secondo numero di a tidè l'indice tupla memorizzato come unsigned int2, ed 65535è il massimo per quel tipo ( 2^16 - 1), quindi questo è il limite superiore sicuro.

SQL Fiddle (riutilizzando una tabella semplice da un caso diverso.)

Strumenti per misurare le dimensioni di riga / tabella:

Misura la dimensione di una riga della tabella PostgreSQL

Disco pieno

È necessario spostare spazio su disco per una di queste operazioni. C'è anche lo strumento di comunità pg_repackin sostituzione di VACUUM FULL/ CLUSTER. Evita i blocchi esclusivi ma necessita anche di spazio libero per lavorare. Il manuale:

Richiede spazio libero su disco doppio rispetto alla tabella o alle tabelle di destinazione e agli indici.

Come ultima risorsa, è possibile eseguire un ciclo di dump / ripristino. Ciò rimuove anche tutto il gonfiore da tabelle e indici. Domanda strettamente correlata:

Devo eseguire VACUUM FULL senza spazio su disco disponibile

La risposta laggiù è piuttosto radicale. Se la tua situazione lo consente (senza chiavi esterne o altri riferimenti che impediscono l'eliminazione di righe) e nessun accesso simultaneo alla tabella), puoi semplicemente:

Scarica la tabella su disco collegandosi da un computer remoto con molto spazio su disco ( -aper --data-only):

Dalla shell remota, scaricare i dati della tabella:

pg_dump -h <host_name> -p <port> -t mytbl -a mydb > db_mytbl.sql

In una sessione PG, TRUNCATEla tabella:

-- drop all indexes and constraints here for best performance
TRUNCATE mytbl;

Dalla shell remota, ripristina sulla stessa tabella:

psql -h <host_name> -p <port> mydb -f db_mytbl.sql
-- recreate all indexes and constraints here

Ora è libero da file o gonfiori morti.

Ma forse puoi avere quello più semplice?

Puoi fare abbastanza spazio sul disco cancellando (spostando) file non correlati?
Puoi VACUUM FULLprima tavoli più piccoli, uno per uno, liberando così spazio su disco sufficiente?
Puoi eseguire REINDEX TABLEo REINDEX INDEXliberare spazio su disco da indici gonfiati?

Qualunque cosa tu faccia, non essere avventato . In caso di dubbi, eseguire prima il backup di tutto in un luogo sicuro.

— Erwin Brandstetter
fonte

Erwin, scusa, ho dimenticato di dire che non ho abbastanza spazio per il vuoto completo. Aggiornato la domanda.

— sbagliato su tutto il

@Zapadlo: ho aggiunto un capitolo per la domanda aggiornata.

— Erwin Brandstetter,

Grazie per la risposta esaustiva. In realtà, ho pensato di riuscire a posizionare righe morte alla fine delle pagine di database mediante aggiornamenti falsi, ad esempio update table set field_1 = field_1, ma l'aspirazione di quella tabella dopo quell'operazione non è riuscita a restituire spazio libero, qualche idea?

— sbagliato su tutto

@Zapadlo: le idee che ho avuto sono già nella risposta. :) Non conosco uno strumento in grado di riordinare le tuple morte senza bisogno di spazio di manovra sostanziale sul disco. (Non significa che non ce ne possa essere uno là fuori.)

— Erwin Brandstetter,

Dicono che questo strumento fa il trucco, ma non l'ho ancora provato: code.google.com/p/pgtoolkit/source/browse/trunk/bin/…

— sbagliato su tutto