Penso di aver trovato la soluzione. Da qualche tempo stavo guardando Percona Server per sostituire i miei server MySQL, e ora penso che ci sia una buona ragione per questo.
Il server Percona introduce molte nuove tabelle INFORMATION_SCHEMA come INNODB_TABLE_STATS, che non è disponibile nel server MySQL standard. Quando lo fai:
SELECT rows, modified FROM information_schema.innodb_table_stats WHERE table_schema='db' AND table_name='table'
Ottieni il conteggio delle righe e un contatore. La documentazione ufficiale dice quanto segue su questo campo:
Se il valore della colonna modificata supera "righe / 16" o 2000000000, il ricalcolo delle statistiche viene eseguito quando innodb_stats_auto_update == 1. Possiamo stimare la vecchiaia delle statistiche con questo valore.
Quindi questo contatore si avvolge di tanto in tanto, ma puoi fare un checksum del numero di righe e del contatore, e quindi ad ogni modifica della tabella ottieni un checksum unico. Per esempio:
SELECT MD5(CONCAT(rows,'_',modified)) AS checksum FROM information_schema.innodb_table_stats WHERE table_schema='db' AND table_name='table';
Avrei comunque aggiornato i miei server al server Percona, quindi questo limite non è un problema per me. La gestione di centinaia di trigger e l'aggiunta di campi alle tabelle è una vera seccatura per questa applicazione, perché è in fase molto avanzata di sviluppo.
Questa è la funzione PHP che ho creato per assicurarsi che le tabelle possano essere verificate indipendentemente dal motore e dal server utilizzati:
function checksum_table($input_tables){
if(!$input_tables) return false; // Sanity check
$tables = (is_array($input_tables)) ? $input_tables : array($input_tables); // Make $tables always an array
$where = "";
$checksum = "";
$found_tables = array();
$tables_indexed = array();
foreach($tables as $table_name){
$tables_indexed[$table_name] = true; // Indexed array for faster searching
if(strstr($table_name,".")){ // If we are passing db.table_name
$table_name_split = explode(".",$table_name);
$where .= "(table_schema='".$table_name_split[0]."' AND table_name='".$table_name_split[1]."') OR ";
}else{
$where .= "(table_schema=DATABASE() AND table_name='".$table_name."') OR ";
}
}
if($where != ""){ // Sanity check
$where = substr($where,0,-4); // Remove the last "OR"
$get_chksum = mysql_query("SELECT table_schema, table_name, rows, modified FROM information_schema.innodb_table_stats WHERE ".$where);
while($row = mysql_fetch_assoc($get_chksum)){
if($tables_indexed[$row[table_name]]){ // Not entirely foolproof, but saves some queries like "SELECT DATABASE()" to find out the current database
$found_tables[$row[table_name]] = true;
}elseif($tables_indexed[$row[table_schema].".".$row[table_name]]){
$found_tables[$row[table_schema].".".$row[table_name]] = true;
}
$checksum .= "_".$row[rows]."_".$row[modified]."_";
}
}
foreach($tables as $table_name){
if(!$found_tables[$table_name]){ // Table is not found in information_schema.innodb_table_stats (Probably not InnoDB table or not using Percona Server)
$get_chksum = mysql_query("CHECKSUM TABLE ".$table_name); // Checksuming the old-fashioned way
$chksum = mysql_fetch_assoc($get_chksum);
$checksum .= "_".$chksum[Checksum]."_";
}
}
$checksum = sprintf("%s",crc32($checksum)); // Using crc32 because it's faster than md5(). Must be returned as string to prevent PHPs signed integer problems.
return $checksum;
}
Puoi usarlo in questo modo:
// checksum a signle table in the current db
$checksum = checksum_table("test_table");
// checksum a signle table in db other than the current
$checksum = checksum_table("other_db.test_table");
// checksum multiple tables at once. It's faster when using Percona server, because all tables are checksummed via one select.
$checksum = checksum_table(array("test_table, "other_db.test_table"));
Spero che questo risparmi qualche problema ad altre persone che hanno lo stesso problema.