PostgreSQL :::danger 使用以下导出时注意当前系统的编码环境,否则会遇到编码不一致导致无法导入的问题。 :::
1、pg_dump
- pg_dump — 将一个PostgreSQL数据库导出到一个脚本文件或者其它归档文件中。
- pg_dump是一个用于备份PostgreSQL数据库的实用工具,即使当前数据库正在使用,也能够生成一致性的备份,且不会阻塞其他用户访问数据库(包括读、写)。
- PostgreSQL提供的一个工具pg_dump,逻辑导出数据,生成sql文件或其他格式文件。
- pg_dump是一个客户端工具,可以远程或本地导出逻辑数据,恢复数据至导出时间点。
- pg_dump只能备份一个数据库
- pg_dump 一次只转储一个数据库,并不会转储有关角色或表空间的信息 (因为那些是群集范围而不是每个数据库)。
1.pg_dump导出整个数据库
```bash pg_dump -h localhost -U postgres(用户名) -d DBNAME(数据库名(缺省时同用户名)) > /data/dum.sql
use
[postgres@vmonline postgres]$ pg_dump -h localhost -U postgres -d pgtest > ~/dum.sql
**其它导出示例:**
```bash
# 操作系统平面文件格式
$ pg_dump -h 192.168.6.16 -U highgo -p 5433 -Fp -t test_dump > /tmp/test_dump1.dmp highgo
#自定义格式
$ pg_dump -h 192.168.6.16 -U highgo -p 5433 -Fc -t test_dump > /tmp/test_dump2.dmp highgo
#tar包格式
$ pg_dump -h 192.168.6.16 -U highgo -p 5433 -Ft -t test_dump > /tmp/test_dump3.dmp highgo
#自定义、0级压缩格式
$ pg_dump -h 192.168.6.16 -U highgo -p 5433 -Fc -Z 0 -t test_dump > /tmp/test_dump4.dmp highgo
#自定义、9级压缩格式
$ pg_dump -h 192.168.6.16 -U highgo -p 5433 -Fc -Z 9 -t test_dump > /tmp/test_dump5.dmp highgo
#显示信息内容
$ pg_dump -h 192.168.6.16 -U highgo -p 5433 -Fc -v -t test_dump > /tmp/test_dump6.dmp highgo
验证不同格式的文件:
# ll
-rw-rw-r-- 1 pg pg 379738 Nov 1 15:05 test_dump1.dmp
-rw-rw-r-- 1 pg pg 217142 Nov 1 15:05 test_dump2.dmp
-rw-rw-r-- 1 pg pg 384512 Nov 1 15:05 test_dump3.dmp
-rw-rw-r-- 1 pg pg 429852 Nov 1 15:08 test_dump4.dmp
-rw-rw-r-- 1 pg pg 217142 Nov 1 15:07 test_dump5.dmp
压缩格式的文件明显较小
不同格式的文件
# file test_dump1.dmp
test_dump1.dmp: ASCII text
# file test_dump2.dmp
test_dump2.dmp: PostgreSQL custom database dump - v1.13-0
# file test_dump3.dmp
test_dump3.dmp: POSIX tar archive
# file test_dump4.dmp
test_dump4.dmp: PostgreSQL custom database dump - v1.13-0
注意1:默认是-Fp格式(操作系统平面文件)
注意2:并行导出只支持-Fd 目录格式
$ pg_dump -h 192.168.6.16 -U highgo -p 5433 -Fc -v -Z 1 -t test_dump > /tmp/test_dump3.dmp highgo
pg_dump: parallel backup only supported by the directory format
2.pg_dump导出某个表
pg_dump -h localhost -U postgres(用户名) 数据库名(缺省时同用户名) -t table(表名) >/data/dum.sql
#use
pg_dump -h localhost -U postgres pgtest -t public.test_table> ~/dum_test_table.sql
#注意:public.test_table中, 'public'是模式名称, 'test_table'是模式中的表名称
3.pg_dump导出某个模式
pg_dump导出public模式:
pg_dump -h localhost -U postgres(用户名) 数据库名(缺省时同用户名) -s public(模式名称) >/data/dum.sql
[postgres@vmonline ~]$pg_dump -h localhost -U postgres pgtest -s public> /home/lpf/public.sql
4.pg_dump 及pgsql配置密码导出数据
# 数据库导出 --
psql "host=XX.XX.XX.XX port=5432 user=XXX password=XXX dbname=XXX" -f table_name.sql
#use
pg_dump "host=localhost port=5432 user=postgres password=123456 dbname=pgtest" -f ~/table_name.sql
# ---------------------------------------------------- #
# 数据库表导出
pg_dump "host=XX.XX.XX.XX port=5432 user=XXXX password=XXXX dbname=XXXXX" -t table_name -f table_name.sql
5.pgsql导入整个数据库
psql -U postgres(用户名) 数据库名(缺省时同用户名) < /data/dum.sql
#use
[postgres@vmonline ~]$ psql -U postgres pgtest < ~/dum.sql
.\psql.exe -h 127.71.160.31 -U postgres -d business -f D:\LinkSpace\Work\WorkFiles\Fcant\business.sql
#pg_restore导入数据库
pg_restore -h 192.168.0.100 -p 5432 -U postgres -W -d us2011 -v "/root/us2010.backup"
2、pg_dumpall
- 如果要备份Cluster中数据库共有的全局对象,例如角色和表空间,需要使用pg_dumpall。
- 备份文件以文本或存档文件格式输出。
- Script dumps是一个普通文本文件,包含将数据库重构到保存时的状态所需的SQL命令。
- 要从这样的脚本恢复,需要将其提供给psql。脚本文件甚至可以用来在其他机器或者其他架构上重构数据库;进行一些必要的修改,甚至可以在其他数据库上使用。
- pg_dumpall 在给定的群集中备份每个数据库, 并保留群集范围内的数据, 如角色和表空间定义。
pg_dumpall导出及psql恢复
```bashpg_dumpall导出
su postgres #(需要切换到系统的postgres用户来进行备份) pg_dumpall > /backup/all_the_data.backup #(备份整个数据库集群)
psql恢复
su postgres psql -f /backup/all_the_data.backup postgres exit
<a name="Y7foN"></a>
## 3、pg_restore
PostgreSQL提供的一个工具pg_restore用来导入数据
<a name="QRVeL"></a>
### pg_restore恢复
```bash
#pg_restore恢复示例
pg_restore -h 192.168.0.100 -p 5432 -U postgres -W -d us2011 -v "/root/us2010.backup"
4、压缩方法
一般用dump导出数据会比较大,推荐使用xz压缩
压缩方法:
xz dum.sql
xz压缩数据导入数据库方法
xzcat /data/dum.sql.xz | psql -h localhost -U postgres(用户名) 数据库名(缺省时同用户名)
5、附录
1.pg_dump工具参数
❯ .\pg_dump.exe --help
pg_dump 把一个数据库转储为纯文本文件或者是其它格式.
用法:
pg_dump [选项]... [数据库名字]
一般选项:
-f, --file=FILENAME 输出文件或目录名
-F, --format=c|d|t|p 输出文件格式 (定制, 目录, tar
明文 (默认值))
-j, --jobs=NUM 执行多个并行任务进行备份转储工作
-v, --verbose 详细模式
-V, --version 输出版本信息,然后退出
-Z, --compress=0-9 被压缩格式的压缩级别
--lock-wait-timeout=TIMEOUT 在等待表锁超时后操作失败
--no-sync 不用等待变化安全写入磁盘
-?, --help 显示此帮助, 然后退出
控制输出内容选项:
-a, --data-only 只转储数据,不包括模式
-b, --blobs 在转储中包括大对象
-B, --no-blobs 排除转储中的大型对象
-c, --clean 在重新创建之前,先清除(删除)数据库对象
-C, --create 在转储中包括命令,以便创建数据库
-E, --encoding=ENCODING 转储以ENCODING形式编码的数据
-n, --schema=PATTERN dump the specified schema(s) only
-N, --exclude-schema=PATTERN do NOT dump the specified schema(s)
-O, --no-owner 在明文格式中, 忽略恢复对象所属者
-s, --schema-only 只转储模式, 不包括数据
-S, --superuser=NAME 在明文格式中使用指定的超级用户名
-t, --table=PATTERN dump the specified table(s) only
-T, --exclude-table=PATTERN do NOT dump the specified table(s)
-x, --no-privileges 不要转储权限 (grant/revoke)
--binary-upgrade 只能由升级工具使用
--column-inserts 以带有列名的INSERT命令形式转储数据
--disable-dollar-quoting 取消美元 (符号) 引号, 使用 SQL 标准引号
--disable-triggers 在只恢复数据的过程中禁用触发器
--enable-row-security 启用行安全性(只转储用户能够访问的内容)
--exclude-table-data=PATTERN do NOT dump data for the specified table(s)
--extra-float-digits=NUM 覆盖extra_float_digits的默认设置
--if-exists 当删除对象时使用IF EXISTS
--include-foreign-data=PATTERN
include data of foreign tables on foreign
servers matching PATTERN
--inserts 以INSERT命令,而不是COPY命令的形式转储数据
--load-via-partition-root 通过根表加载分区
--no-comments 不转储注释
--no-publications 不转储发布
--no-security-labels 不转储安全标签的分配
--no-subscriptions 不转储订阅
--no-synchronized-snapshots 在并行工作集中不使用同步快照
--no-tablespaces 不转储表空间分配信息
--no-unlogged-table-data 不转储没有日志的表数据
--on-conflict-do-nothing 将ON CONFLICT DO NOTHING添加到INSERT命令
--quote-all-identifiers 所有标识符加引号,即使不是关键字
--rows-per-insert=NROWS 每个插入的行数;意味着--inserts
--section=SECTION 备份命名的节 (数据前, 数据, 及 数据后)
--serializable-deferrable 等到备份可以无异常运行
--snapshot=SNAPSHOT 为转储使用给定的快照
--strict-names 要求每个表和(或)schema包括模式以匹配至少一个实体
--use-set-session-authorization
使用 SESSION AUTHORIZATION 命令代替
ALTER OWNER 命令来设置所有权
联接选项:
-d, --dbname=DBNAME 对数据库 DBNAME备份
-h, --host=主机名 数据库服务器的主机名或套接字目录
-p, --port=端口号 数据库服务器的端口号
-U, --username=名字 以指定的数据库用户联接
-w, --no-password 永远不提示输入口令
-W, --password 强制口令提示 (自动)
--role=ROLENAME 在转储前运行SET ROLE
如果没有提供数据库名字, 那么使用 PGDATABASE 环境变量
的数值.
Report bugs to <pgsql-bugs@lists.postgresql.org>.
PostgreSQL home page: <https://www.postgresql.org/>
2.pg_dumpall工具参数
❯ .\pg_dumpall.exe --help
pg_dumpall 抽取一个 PostgreSQL 数据库簇进一个 SQL 脚本文件.
用法:
pg_dumpall [选项]...
一般选项:
-f, --file=FILENAME 输出文件名
-v, --verbose 详细模式
-V, --version 输出版本信息,然后退出
--lock-wait-timeout=TIMEOUT 在等待表锁超时后操作失败
-?, --help 显示此帮助, 然后退出
控制输出内容选项:
-a, --data-only 只转储数据,不包括模式
-c, --clean 在重新创建数据库前先清除(删除)数据库
-E, --encoding=ENCODING 转储以ENCODING形式编码的数据
-g, --globals-only 只转储全局对象, 不包括数据库
-O, --no-owner 不恢复对象所属者
-r, --roles-only 只转储角色,不包括数据库或表空间
-s, --schema-only 只转储模式, 不包括数据
-S, --superuser=NAME 在转储中, 指定的超级用户名
-t, --tablespaces-only 只转储表空间,而不转储数据库或角色
-x, --no-privileges 不要转储权限 (grant/revoke)
--binary-upgrade 只能由升级工具使用
--column-inserts 以带有列名的INSERT命令形式转储数据
--disable-dollar-quoting 取消美元 (符号) 引号, 使用 SQL 标准引号
--disable-triggers 在只恢复数据的过程中禁用触发器
--exclude-database=PATTERN 排除名称与PATTERN匹配的数据库
--extra-float-digits=NUM 覆盖extra_float_digits的默认设置
--if-exists 当删除对象时使用IF EXISTS
--inserts 以INSERT命令,而不是COPY命令的形式转储数据
--load-via-partition-root 通过根表加载分区
--no-comments 不转储注释
--no-publications 不转储发布
--no-role-passwords 不转储角色的密码
--no-security-labels 不转储安全标签的分配
--no-subscriptions 不转储订阅
--no-sync 不用等待变化安全写入磁盘
--no-tablespaces 不转储表空间分配信息
--no-unlogged-table-data 不转储没有日志的表数据
--on-conflict-do-nothing 将ON CONFLICT DO NOTHING添加到INSERT命令
--quote-all-identifiers 所有标识符加引号,即使不是关键字
--rows-per-insert=NROWS 每个插入的行数;意味着--inserts
--use-set-session-authorization
使用 SESSION AUTHORIZATION 命令代替
ALTER OWNER 命令来设置所有权
联接选项:
-d, --dbname=CONNSTR 连接数据库使用的连接串
-h, --host=主机名 数据库服务器的主机名或套接字目录
-l, --database=DBNAME 另一个缺省数据库
-p, --port=端口号 数据库服务器的端口号
-U, --username=名字 以指定的数据库用户联接
-w, --no-password 永远不提示输入口令
-W, --password 强制口令提示 (自动)
--role=ROLENAME 在转储前运行SET ROLE
如果没有使用 -f/--file,那么将把SQL脚本写到标准输出.
Report bugs to <pgsql-bugs@lists.postgresql.org>.
PostgreSQL home page: <https://www.postgresql.org/>
3.pg_restore工具参数
❯ .\pg_restore.exe --help
pg_restore 从一个归档中恢复一个由 pg_dump 创建的 PostgreSQL 数据库.
用法:
pg_restore [选项]... [文件名]
一般选项:
-d, --dbname=名字 连接数据库名字
-f, --file=文件名 输出文件名(- 对于stdout)
-F, --format=c|d|t 备份文件格式(应该自动进行)
-l, --list 打印归档文件的 TOC 概述
-v, --verbose 详细模式
-V, --version 输出版本信息, 然后退出
-?, --help 显示此帮助, 然后退出
恢复控制选项:
-a, --data-only 只恢复数据, 不包括模式
-c, --clean 在重新创建之前,先清除(删除)数据库对象
-C, --create 创建目标数据库
-e, --exit-on-error 发生错误退出, 默认为继续
-I, --index=NAME 恢复指定名称的索引
-j, --jobs=NUM 执行多个并行任务进行恢复工作
-L, --use-list=FILENAME 从这个文件中使用指定的内容表排序
输出
-n, --schema=NAME 在这个模式中只恢复对象
-N, --exclude-schema=NAME 不恢复此模式中的对象
-O, --no-owner 不恢复对象所属者
-P, --function=NAME(args) 恢复指定名字的函数
-s, --schema-only 只恢复模式, 不包括数据
-S, --superuser=NAME 使用指定的超级用户来禁用触发器
-t, --table=NAME 恢复命名关系(表、视图等)
-T, --trigger=NAME 恢复指定名字的触发器
-x, --no-privileges 跳过处理权限的恢复 (grant/revoke)
-1, --single-transaction 作为单个事务恢复
--disable-triggers 在只恢复数据的过程中禁用触发器
--enable-row-security 启用行安全性
--if-exists 当删除对象时使用IF EXISTS
--no-comments 不恢复注释
--no-data-for-failed-tables 对那些无法创建的表不进行
数据恢复
--no-publications 不恢复发行
--no-security-labels 不恢复安全标签信息
--no-subscriptions 不恢复订阅
--no-tablespaces 不恢复表空间的分配信息
--section=SECTION 恢复命名节 (数据前、数据及数据后)
--strict-names 要求每个表和(或)schema包括模式以匹配至少一个实体
--use-set-session-authorization
使用 SESSION AUTHORIZATION 命令代替
ALTER OWNER 命令来设置所有权
联接选项:
-h, --host=主机名 数据库服务器的主机名或套接字目录
-p, --port=端口号 数据库服务器的端口号
-U, --username=名字 以指定的数据库用户联接
-w, --no-password 永远不提示输入口令
-W, --password 强制口令提示 (自动)
--role=ROLENAME 在恢复前执行SET ROLE操作
选项 -I, -n, -N, -P, -t, -T, 以及 --section 可以组合使用和指定
多次用于选择多个对象.
如果没有提供输入文件名, 则使用标准输入.
Report bugs to <pgsql-bugs@lists.postgresql.org>.
PostgreSQL home page: <https://www.postgresql.org/>
6、POSTGRES数据库导出导入的问题
A.编码问题
基础知识
需要关心3个字符集
1)一个是执行命令所在系统环境的字符集,如果是cygdrive,查看LANG默认是utf8,如果是powershell,用chcp
命令结果为936,代表gbk。
2)一个是数据库server编码,在psql中运行 show server_encoding,结果为utf8。这个编码不太好改,而且官方文档说了不支持gbk(https://www.postgresql.org/docs/12/multibyte.html)。
3)一个是client编码,show client_encoding
,结果是gbk。这个可以通过set client_encoding=xx
来改变。
遇到的问题及解释
在powershell里使用pg_dump命令导出全库,然后再使用psql命令导入,遇到了gbk字符在utf8没有对应值的报错。
原因:通过vim查看导出文件编码,显示为utf-161e,不是utf8。虽然client编码是gbk,与文件一致,但是导入是要先经过server,因为与server编码不一致,所以报错。
解决方法及经验总结
将导出文件转码为utf8就可以导入了,但是数据的某些行导入时还有问题,会导致整个表数据不会插入。但这已经是最好的结果了。 :::tips 经验总结:以后导出文件时,应关注环境编码,在utf8环境下导出,比如使用cygdrive,或者将powershell的编码改成utf8(chcp 65001),这样导出文件编码就是utf8,与server编码相同,server又会将数据转码为client编码,导入时就不会有任何问题了。 :::