Sto usando Fedora 15
con PostgreSQL 9.1.4
. Fedora si è schiantato di recente dopo di che:
Un tentativo di avviare il server PostgreSQL:
service postgresql-9.1 start
dà
Starting postgresql-9.1 (via systemctl): Job failed. See system logs and 'systemctl status' for details.
[FAILED]
Tuttavia, il server si avvia normalmente quando avvio il server per la prima volta dopo il riavvio del sistema .
Tuttavia, un tentativo di utilizzo psql
genera questo errore:
psql: could not connect to server: No such file or directory
Is the server running locally and accepting
connections on Unix domain socket "/tmp/.s.PGSQL.5432"?
.s.PGSQL.5432
il file non è presente in nessun punto del sistema. A locate .s.PGSQL.5432
non emette nulla.
Il registro di sistema ha questo:
Aug 14 17:31:58 localhost systemd[1]: postgresql-9.1.service: control process exited, code=exited status=1
Aug 14 17:31:58 localhost systemd[1]: Unit postgresql-9.1.service entered failed state.
UN
systemctl status postgresql-9.1.service
dà
postgresql-9.1.service - SYSV: PostgreSQL database server.
Loaded: loaded (/etc/rc.d/init.d/postgresql-9.1)
Active: failed since Tue, 14 Aug 2012 17:31:58 +0530; 58s ago
Process: 2811 ExecStop=/etc/rc.d/init.d/postgresql-9.1 stop (code=exited, status=1/FAILURE)
Process: 12423 ExecStart=/etc/rc.d/init.d/postgresql-9.1 start (code=exited, status=1/FAILURE)
Main PID: 2551 (code=exited, status=1/FAILURE)
CGroup: name=systemd:/system/postgresql-9.1.service
Non avevo modificato l'impostazione predefinita di fsync, quindi suppongo che fosse impostato su on
. Sono su un HDD. L'HDD si è bloccato.
Crash dell'HDD
Il crash dell'HDD ha provocato l'esecuzione di un manuale fsck
su un prompt e non basato sulla GUI. Con esso riparando gazillion inode ecc. Dopo di che ho riavviato il sistema con un Ctrl+ Alt+ Delete.
Il registro di PostgreSQL ha questo:
LOG: database system was interrupted; last known up at 2012-08-14 17:31:57 IST
LOG: database system was not properly shut down; automatic recovery in progress
LOG: record with zero length at 0/41A4E58
LOG: redo is not required
FATAL: could not access status of transaction 1
DETAIL: Could not open file "pg_multixact/offsets/0000": No such file or directory.
LOG: startup process (PID 13016) exited with exit code 1
LOG: aborting startup due to startup process failure
Aggiornare
Il tentativo di avviare il server dopo aver /var/lib/pgsql
eseguito una copia della directory a livello di file system e l'esecuzione ./pg_resetxlog -f /var/lib/pgsql/9.1/data/
con il risultato xlog -f /var/lib/pgsql/9.1/data/
restituisce comunque:
LOG: database system was interrupted; last known up at 2012-08-14 18:46:36 IST
LOG: database system was not properly shut down; automatic recovery in progress
LOG: record with zero length at 0/6000078
LOG: redo is not required
FATAL: could not access status of transaction 1
DETAIL: Could not open file "pg_multixact/offsets/0000": No such file or directory.
LOG: startup process (PID 13766) exited with exit code 1
LOG: aborting startup due to startup process failure
pg_resetxlog
non ha fatto nulla di buono, quindi sei in un territorio divertente. Hai un backup di questo database da prima dell'incidente?
pg_multixact/offsets/0000
quel Pg accetterebbe ...