PostgreSQL :::danger 使用以下导出时注意当前系统的编码环境,否则会遇到编码不一致导致无法导入的问题。 :::
1、pg_dump
- pg_dump — 将一个PostgreSQL数据库导出到一个脚本文件或者其它归档文件中。
- pg_dump是一个用于备份PostgreSQL数据库的实用工具,即使当前数据库正在使用,也能够生成一致性的备份,且不会阻塞其他用户访问数据库(包括读、写)。
- PostgreSQL提供的一个工具pg_dump,逻辑导出数据,生成sql文件或其他格式文件。
- pg_dump是一个客户端工具,可以远程或本地导出逻辑数据,恢复数据至导出时间点。
- pg_dump只能备份一个数据库
- pg_dump 一次只转储一个数据库,并不会转储有关角色或表空间的信息 (因为那些是群集范围而不是每个数据库)。
1.pg_dump导出整个数据库
```bash pg_dump -h localhost -U postgres(用户名) -d DBNAME(数据库名(缺省时同用户名)) > /data/dum.sql
use
[postgres@vmonline postgres]$ pg_dump -h localhost -U postgres -d pgtest > ~/dum.sql
**其它导出示例:**```bash# 操作系统平面文件格式$ pg_dump -h 192.168.6.16 -U highgo -p 5433 -Fp -t test_dump > /tmp/test_dump1.dmp highgo#自定义格式$ pg_dump -h 192.168.6.16 -U highgo -p 5433 -Fc -t test_dump > /tmp/test_dump2.dmp highgo#tar包格式$ pg_dump -h 192.168.6.16 -U highgo -p 5433 -Ft -t test_dump > /tmp/test_dump3.dmp highgo#自定义、0级压缩格式$ pg_dump -h 192.168.6.16 -U highgo -p 5433 -Fc -Z 0 -t test_dump > /tmp/test_dump4.dmp highgo#自定义、9级压缩格式$ pg_dump -h 192.168.6.16 -U highgo -p 5433 -Fc -Z 9 -t test_dump > /tmp/test_dump5.dmp highgo#显示信息内容$ pg_dump -h 192.168.6.16 -U highgo -p 5433 -Fc -v -t test_dump > /tmp/test_dump6.dmp highgo
验证不同格式的文件:
# ll-rw-rw-r-- 1 pg pg 379738 Nov 1 15:05 test_dump1.dmp-rw-rw-r-- 1 pg pg 217142 Nov 1 15:05 test_dump2.dmp-rw-rw-r-- 1 pg pg 384512 Nov 1 15:05 test_dump3.dmp-rw-rw-r-- 1 pg pg 429852 Nov 1 15:08 test_dump4.dmp-rw-rw-r-- 1 pg pg 217142 Nov 1 15:07 test_dump5.dmp压缩格式的文件明显较小不同格式的文件# file test_dump1.dmptest_dump1.dmp: ASCII text# file test_dump2.dmptest_dump2.dmp: PostgreSQL custom database dump - v1.13-0# file test_dump3.dmptest_dump3.dmp: POSIX tar archive# file test_dump4.dmptest_dump4.dmp: PostgreSQL custom database dump - v1.13-0注意1:默认是-Fp格式(操作系统平面文件)注意2:并行导出只支持-Fd 目录格式$ pg_dump -h 192.168.6.16 -U highgo -p 5433 -Fc -v -Z 1 -t test_dump > /tmp/test_dump3.dmp highgopg_dump: parallel backup only supported by the directory format
2.pg_dump导出某个表
pg_dump -h localhost -U postgres(用户名) 数据库名(缺省时同用户名) -t table(表名) >/data/dum.sql#usepg_dump -h localhost -U postgres pgtest -t public.test_table> ~/dum_test_table.sql#注意:public.test_table中, 'public'是模式名称, 'test_table'是模式中的表名称
3.pg_dump导出某个模式
pg_dump导出public模式:pg_dump -h localhost -U postgres(用户名) 数据库名(缺省时同用户名) -s public(模式名称) >/data/dum.sql[postgres@vmonline ~]$pg_dump -h localhost -U postgres pgtest -s public> /home/lpf/public.sql
4.pg_dump 及pgsql配置密码导出数据
# 数据库导出 --psql "host=XX.XX.XX.XX port=5432 user=XXX password=XXX dbname=XXX" -f table_name.sql#usepg_dump "host=localhost port=5432 user=postgres password=123456 dbname=pgtest" -f ~/table_name.sql# ---------------------------------------------------- ## 数据库表导出pg_dump "host=XX.XX.XX.XX port=5432 user=XXXX password=XXXX dbname=XXXXX" -t table_name -f table_name.sql
5.pgsql导入整个数据库
psql -U postgres(用户名) 数据库名(缺省时同用户名) < /data/dum.sql#use[postgres@vmonline ~]$ psql -U postgres pgtest < ~/dum.sql.\psql.exe -h 127.71.160.31 -U postgres -d business -f D:\LinkSpace\Work\WorkFiles\Fcant\business.sql#pg_restore导入数据库pg_restore -h 192.168.0.100 -p 5432 -U postgres -W -d us2011 -v "/root/us2010.backup"
2、pg_dumpall
- 如果要备份Cluster中数据库共有的全局对象,例如角色和表空间,需要使用pg_dumpall。
- 备份文件以文本或存档文件格式输出。
- Script dumps是一个普通文本文件,包含将数据库重构到保存时的状态所需的SQL命令。
- 要从这样的脚本恢复,需要将其提供给psql。脚本文件甚至可以用来在其他机器或者其他架构上重构数据库;进行一些必要的修改,甚至可以在其他数据库上使用。
- pg_dumpall 在给定的群集中备份每个数据库, 并保留群集范围内的数据, 如角色和表空间定义。
pg_dumpall导出及psql恢复
```bashpg_dumpall导出
su postgres #(需要切换到系统的postgres用户来进行备份) pg_dumpall > /backup/all_the_data.backup #(备份整个数据库集群)
psql恢复
su postgres psql -f /backup/all_the_data.backup postgres exit
<a name="Y7foN"></a>## 3、pg_restorePostgreSQL提供的一个工具pg_restore用来导入数据<a name="QRVeL"></a>### pg_restore恢复```bash#pg_restore恢复示例pg_restore -h 192.168.0.100 -p 5432 -U postgres -W -d us2011 -v "/root/us2010.backup"
4、压缩方法
一般用dump导出数据会比较大,推荐使用xz压缩
压缩方法:
xz dum.sql
xz压缩数据导入数据库方法
xzcat /data/dum.sql.xz | psql -h localhost -U postgres(用户名) 数据库名(缺省时同用户名)
5、附录
1.pg_dump工具参数
❯ .\pg_dump.exe --helppg_dump 把一个数据库转储为纯文本文件或者是其它格式.用法:pg_dump [选项]... [数据库名字]一般选项:-f, --file=FILENAME 输出文件或目录名-F, --format=c|d|t|p 输出文件格式 (定制, 目录, tar明文 (默认值))-j, --jobs=NUM 执行多个并行任务进行备份转储工作-v, --verbose 详细模式-V, --version 输出版本信息,然后退出-Z, --compress=0-9 被压缩格式的压缩级别--lock-wait-timeout=TIMEOUT 在等待表锁超时后操作失败--no-sync 不用等待变化安全写入磁盘-?, --help 显示此帮助, 然后退出控制输出内容选项:-a, --data-only 只转储数据,不包括模式-b, --blobs 在转储中包括大对象-B, --no-blobs 排除转储中的大型对象-c, --clean 在重新创建之前,先清除(删除)数据库对象-C, --create 在转储中包括命令,以便创建数据库-E, --encoding=ENCODING 转储以ENCODING形式编码的数据-n, --schema=PATTERN dump the specified schema(s) only-N, --exclude-schema=PATTERN do NOT dump the specified schema(s)-O, --no-owner 在明文格式中, 忽略恢复对象所属者-s, --schema-only 只转储模式, 不包括数据-S, --superuser=NAME 在明文格式中使用指定的超级用户名-t, --table=PATTERN dump the specified table(s) only-T, --exclude-table=PATTERN do NOT dump the specified table(s)-x, --no-privileges 不要转储权限 (grant/revoke)--binary-upgrade 只能由升级工具使用--column-inserts 以带有列名的INSERT命令形式转储数据--disable-dollar-quoting 取消美元 (符号) 引号, 使用 SQL 标准引号--disable-triggers 在只恢复数据的过程中禁用触发器--enable-row-security 启用行安全性(只转储用户能够访问的内容)--exclude-table-data=PATTERN do NOT dump data for the specified table(s)--extra-float-digits=NUM 覆盖extra_float_digits的默认设置--if-exists 当删除对象时使用IF EXISTS--include-foreign-data=PATTERNinclude data of foreign tables on foreignservers matching PATTERN--inserts 以INSERT命令,而不是COPY命令的形式转储数据--load-via-partition-root 通过根表加载分区--no-comments 不转储注释--no-publications 不转储发布--no-security-labels 不转储安全标签的分配--no-subscriptions 不转储订阅--no-synchronized-snapshots 在并行工作集中不使用同步快照--no-tablespaces 不转储表空间分配信息--no-unlogged-table-data 不转储没有日志的表数据--on-conflict-do-nothing 将ON CONFLICT DO NOTHING添加到INSERT命令--quote-all-identifiers 所有标识符加引号,即使不是关键字--rows-per-insert=NROWS 每个插入的行数;意味着--inserts--section=SECTION 备份命名的节 (数据前, 数据, 及 数据后)--serializable-deferrable 等到备份可以无异常运行--snapshot=SNAPSHOT 为转储使用给定的快照--strict-names 要求每个表和(或)schema包括模式以匹配至少一个实体--use-set-session-authorization使用 SESSION AUTHORIZATION 命令代替ALTER OWNER 命令来设置所有权联接选项:-d, --dbname=DBNAME 对数据库 DBNAME备份-h, --host=主机名 数据库服务器的主机名或套接字目录-p, --port=端口号 数据库服务器的端口号-U, --username=名字 以指定的数据库用户联接-w, --no-password 永远不提示输入口令-W, --password 强制口令提示 (自动)--role=ROLENAME 在转储前运行SET ROLE如果没有提供数据库名字, 那么使用 PGDATABASE 环境变量的数值.Report bugs to <pgsql-bugs@lists.postgresql.org>.PostgreSQL home page: <https://www.postgresql.org/>
2.pg_dumpall工具参数
❯ .\pg_dumpall.exe --helppg_dumpall 抽取一个 PostgreSQL 数据库簇进一个 SQL 脚本文件.用法:pg_dumpall [选项]...一般选项:-f, --file=FILENAME 输出文件名-v, --verbose 详细模式-V, --version 输出版本信息,然后退出--lock-wait-timeout=TIMEOUT 在等待表锁超时后操作失败-?, --help 显示此帮助, 然后退出控制输出内容选项:-a, --data-only 只转储数据,不包括模式-c, --clean 在重新创建数据库前先清除(删除)数据库-E, --encoding=ENCODING 转储以ENCODING形式编码的数据-g, --globals-only 只转储全局对象, 不包括数据库-O, --no-owner 不恢复对象所属者-r, --roles-only 只转储角色,不包括数据库或表空间-s, --schema-only 只转储模式, 不包括数据-S, --superuser=NAME 在转储中, 指定的超级用户名-t, --tablespaces-only 只转储表空间,而不转储数据库或角色-x, --no-privileges 不要转储权限 (grant/revoke)--binary-upgrade 只能由升级工具使用--column-inserts 以带有列名的INSERT命令形式转储数据--disable-dollar-quoting 取消美元 (符号) 引号, 使用 SQL 标准引号--disable-triggers 在只恢复数据的过程中禁用触发器--exclude-database=PATTERN 排除名称与PATTERN匹配的数据库--extra-float-digits=NUM 覆盖extra_float_digits的默认设置--if-exists 当删除对象时使用IF EXISTS--inserts 以INSERT命令,而不是COPY命令的形式转储数据--load-via-partition-root 通过根表加载分区--no-comments 不转储注释--no-publications 不转储发布--no-role-passwords 不转储角色的密码--no-security-labels 不转储安全标签的分配--no-subscriptions 不转储订阅--no-sync 不用等待变化安全写入磁盘--no-tablespaces 不转储表空间分配信息--no-unlogged-table-data 不转储没有日志的表数据--on-conflict-do-nothing 将ON CONFLICT DO NOTHING添加到INSERT命令--quote-all-identifiers 所有标识符加引号,即使不是关键字--rows-per-insert=NROWS 每个插入的行数;意味着--inserts--use-set-session-authorization使用 SESSION AUTHORIZATION 命令代替ALTER OWNER 命令来设置所有权联接选项:-d, --dbname=CONNSTR 连接数据库使用的连接串-h, --host=主机名 数据库服务器的主机名或套接字目录-l, --database=DBNAME 另一个缺省数据库-p, --port=端口号 数据库服务器的端口号-U, --username=名字 以指定的数据库用户联接-w, --no-password 永远不提示输入口令-W, --password 强制口令提示 (自动)--role=ROLENAME 在转储前运行SET ROLE如果没有使用 -f/--file,那么将把SQL脚本写到标准输出.Report bugs to <pgsql-bugs@lists.postgresql.org>.PostgreSQL home page: <https://www.postgresql.org/>
3.pg_restore工具参数
❯ .\pg_restore.exe --helppg_restore 从一个归档中恢复一个由 pg_dump 创建的 PostgreSQL 数据库.用法:pg_restore [选项]... [文件名]一般选项:-d, --dbname=名字 连接数据库名字-f, --file=文件名 输出文件名(- 对于stdout)-F, --format=c|d|t 备份文件格式(应该自动进行)-l, --list 打印归档文件的 TOC 概述-v, --verbose 详细模式-V, --version 输出版本信息, 然后退出-?, --help 显示此帮助, 然后退出恢复控制选项:-a, --data-only 只恢复数据, 不包括模式-c, --clean 在重新创建之前,先清除(删除)数据库对象-C, --create 创建目标数据库-e, --exit-on-error 发生错误退出, 默认为继续-I, --index=NAME 恢复指定名称的索引-j, --jobs=NUM 执行多个并行任务进行恢复工作-L, --use-list=FILENAME 从这个文件中使用指定的内容表排序输出-n, --schema=NAME 在这个模式中只恢复对象-N, --exclude-schema=NAME 不恢复此模式中的对象-O, --no-owner 不恢复对象所属者-P, --function=NAME(args) 恢复指定名字的函数-s, --schema-only 只恢复模式, 不包括数据-S, --superuser=NAME 使用指定的超级用户来禁用触发器-t, --table=NAME 恢复命名关系(表、视图等)-T, --trigger=NAME 恢复指定名字的触发器-x, --no-privileges 跳过处理权限的恢复 (grant/revoke)-1, --single-transaction 作为单个事务恢复--disable-triggers 在只恢复数据的过程中禁用触发器--enable-row-security 启用行安全性--if-exists 当删除对象时使用IF EXISTS--no-comments 不恢复注释--no-data-for-failed-tables 对那些无法创建的表不进行数据恢复--no-publications 不恢复发行--no-security-labels 不恢复安全标签信息--no-subscriptions 不恢复订阅--no-tablespaces 不恢复表空间的分配信息--section=SECTION 恢复命名节 (数据前、数据及数据后)--strict-names 要求每个表和(或)schema包括模式以匹配至少一个实体--use-set-session-authorization使用 SESSION AUTHORIZATION 命令代替ALTER OWNER 命令来设置所有权联接选项:-h, --host=主机名 数据库服务器的主机名或套接字目录-p, --port=端口号 数据库服务器的端口号-U, --username=名字 以指定的数据库用户联接-w, --no-password 永远不提示输入口令-W, --password 强制口令提示 (自动)--role=ROLENAME 在恢复前执行SET ROLE操作选项 -I, -n, -N, -P, -t, -T, 以及 --section 可以组合使用和指定多次用于选择多个对象.如果没有提供输入文件名, 则使用标准输入.Report bugs to <pgsql-bugs@lists.postgresql.org>.PostgreSQL home page: <https://www.postgresql.org/>
6、POSTGRES数据库导出导入的问题
A.编码问题
基础知识
需要关心3个字符集
1)一个是执行命令所在系统环境的字符集,如果是cygdrive,查看LANG默认是utf8,如果是powershell,用chcp命令结果为936,代表gbk。
2)一个是数据库server编码,在psql中运行 show server_encoding,结果为utf8。这个编码不太好改,而且官方文档说了不支持gbk(https://www.postgresql.org/docs/12/multibyte.html)。
3)一个是client编码,show client_encoding,结果是gbk。这个可以通过set client_encoding=xx来改变。
遇到的问题及解释
在powershell里使用pg_dump命令导出全库,然后再使用psql命令导入,遇到了gbk字符在utf8没有对应值的报错。
原因:通过vim查看导出文件编码,显示为utf-161e,不是utf8。虽然client编码是gbk,与文件一致,但是导入是要先经过server,因为与server编码不一致,所以报错。
解决方法及经验总结
将导出文件转码为utf8就可以导入了,但是数据的某些行导入时还有问题,会导致整个表数据不会插入。但这已经是最好的结果了。 :::tips 经验总结:以后导出文件时,应关注环境编码,在utf8环境下导出,比如使用cygdrive,或者将powershell的编码改成utf8(chcp 65001),这样导出文件编码就是utf8,与server编码相同,server又会将数据转码为client编码,导入时就不会有任何问题了。 :::
