Opengauss gs_probackup的 PTRACK增量备份引擎
华为opengauss数据库的官方文档是真的没用。原理注意点啥的全都没有。 opengauss提供的pg_probackup的备份功能是基于PTRACK增量备份引擎的。参见pg_probackup下的ptrack.cpp中pg_ptrack_get_pagemapset函数
res = pgut_execute(backup_conn,
"SELECT path,changed_block_number,changed_block_list "
"FROM pg_cbm_get_changed_block($1, $2)",
2, (const char **) params);
这段代码就是调用PTRACK引擎提供的函数,获取一段时间内数据库产生的数据的变化块。 PTRACK基于块变化的增量备份引擎是原生pg没有的一个功能。华为版本的Pg opengauss数据库带这个功能。其实也不是独有的,俄罗斯的一个pg版本Postgres Pro也有这个功能。 原理就是通过固定大小块变化扫描,生成一个位图。实际数据文件是有固定的快大小。启用ptrack模式需要开启cdm功能。位图会记录lsn位置。这个位图是存储在数据库的两个临时文件中的,以此来实现持久化。因此可以认为这个增量备份是没有时间限制的,直到下次恢复为止都可以一直增量备份。 取变化块的关键代码,原理就是从位图中取出两个lsn点之间记录的变化块。
static void copyChangedBlock
(CBMArrayEntry *newEntry, CBMArrayEntry *orgEntry, long *newIndex, long oldIndex, uint32 *offset)
{
int rc = 0;
newEntry[*newIndex].totalBlockNum = newEntry[*newIndex].maxSize =
MIN(MAX_BLOCKNO_PER_TUPLE, orgEntry[oldIndex].totalBlockNum - *offset);
newEntry[*newIndex].changedBlock =
(BlockNumber*)palloc(newEntry[*newIndex].totalBlockNum * sizeof(BlockNumber));
rc = memcpy_s(newEntry[*newIndex].changedBlock,
newEntry[*newIndex].totalBlockNum * sizeof(BlockNumber),
orgEntry[oldIndex].changedBlock + *offset,
newEntry[*newIndex].totalBlockNum * sizeof(BlockNumber));
securec_check(rc, "\0", "\0");
*offset += newEntry[*newIndex].totalBlockNum;
*newIndex = *newIndex + 1;
}
opengauss内部调用的是pg_cbm_get_changed_block这个sql函数,以此来获取一个指定时间内的数据的变化块列表。因此我们可以直接抛弃opengauss的pg_probackup工具自己来实现增量备份。 opengauss源码地址:https://gitee.com/opengauss/openGauss-server
|