PostgreSQL :::danger 使用以下导出时注意当前系统的编码环境，否则会遇到编码不一致导致无法导入的问题。 :::

1、pg_dump

pg_dump — 将一个PostgreSQL数据库导出到一个脚本文件或者其它归档文件中。
pg_dump是一个用于备份PostgreSQL数据库的实用工具，即使当前数据库正在使用，也能够生成一致性的备份，且不会阻塞其他用户访问数据库(包括读、写)。
PostgreSQL提供的一个工具pg_dump,逻辑导出数据，生成sql文件或其他格式文件。
pg_dump是一个客户端工具，可以远程或本地导出逻辑数据，恢复数据至导出时间点。
pg_dump只能备份一个数据库
pg_dump 一次只转储一个数据库，并不会转储有关角色或表空间的信息 (因为那些是群集范围而不是每个数据库)。
1.pg_dump导出整个数据库
```bash pg_dump -h localhost -U postgres(用户名) -d DBNAME（数据库名(缺省时同用户名)） > /data/dum.sql

use

[postgres@vmonline postgres]$ pg_dump -h localhost -U postgres -d pgtest > ~/dum.sql

**其它导出示例：**
```bash
# 操作系统平面文件格式
$ pg_dump -h 192.168.6.16 -U highgo -p 5433 -Fp -t test_dump > /tmp/test_dump1.dmp highgo
#自定义格式
$ pg_dump -h 192.168.6.16 -U highgo -p 5433 -Fc -t test_dump > /tmp/test_dump2.dmp highgo
#tar包格式
$ pg_dump -h 192.168.6.16 -U highgo -p 5433 -Ft -t test_dump > /tmp/test_dump3.dmp highgo
#自定义、0级压缩格式
$ pg_dump -h 192.168.6.16 -U highgo -p 5433 -Fc -Z 0 -t test_dump > /tmp/test_dump4.dmp highgo
#自定义、9级压缩格式
$ pg_dump -h 192.168.6.16 -U highgo -p 5433 -Fc -Z 9 -t test_dump > /tmp/test_dump5.dmp highgo
#显示信息内容
$ pg_dump -h 192.168.6.16 -U highgo -p 5433 -Fc -v -t test_dump > /tmp/test_dump6.dmp highgo

验证不同格式的文件：

# ll
-rw-rw-r-- 1 pg   pg   379738 Nov  1 15:05 test_dump1.dmp
-rw-rw-r-- 1 pg   pg   217142 Nov  1 15:05 test_dump2.dmp
-rw-rw-r-- 1 pg   pg   384512 Nov  1 15:05 test_dump3.dmp
-rw-rw-r-- 1 pg   pg   429852 Nov  1 15:08 test_dump4.dmp
-rw-rw-r-- 1 pg   pg   217142 Nov  1 15:07 test_dump5.dmp
压缩格式的文件明显较小
不同格式的文件
# file test_dump1.dmp
test_dump1.dmp: ASCII text
# file test_dump2.dmp
test_dump2.dmp: PostgreSQL custom database dump - v1.13-0
# file test_dump3.dmp
test_dump3.dmp: POSIX tar archive
# file test_dump4.dmp
test_dump4.dmp: PostgreSQL custom database dump - v1.13-0
注意1：默认是-Fp格式（操作系统平面文件）
注意2：并行导出只支持-Fd 目录格式
$ pg_dump -h 192.168.6.16 -U highgo -p 5433 -Fc -v -Z 1 -t test_dump > /tmp/test_dump3.dmp highgo
pg_dump: parallel backup only supported by the directory format

2.pg_dump导出某个表

pg_dump -h localhost -U postgres(用户名) 数据库名(缺省时同用户名) -t table(表名) >/data/dum.sql
#use
pg_dump -h localhost -U postgres pgtest -t public.test_table> ~/dum_test_table.sql
#注意：public.test_table中, 'public'是模式名称, 'test_table'是模式中的表名称

3.pg_dump导出某个模式

pg_dump导出public模式:  
pg_dump -h localhost -U postgres(用户名) 数据库名(缺省时同用户名) -s public(模式名称) >/data/dum.sql  
[postgres@vmonline ~]$pg_dump -h localhost -U postgres pgtest -s public> /home/lpf/public.sql

4.pg_dump 及pgsql配置密码导出数据

# 数据库导出 -- 
psql "host=XX.XX.XX.XX port=5432  user=XXX password=XXX dbname=XXX" -f table_name.sql
#use
pg_dump "host=localhost port=5432 user=postgres password=123456 dbname=pgtest" -f ~/table_name.sql
# ---------------------------------------------------- #
# 数据库表导出
pg_dump "host=XX.XX.XX.XX port=5432 user=XXXX password=XXXX dbname=XXXXX" -t table_name -f table_name.sql

5.pgsql导入整个数据库

psql -U postgres(用户名)  数据库名(缺省时同用户名) < /data/dum.sql
#use
[postgres@vmonline ~]$ psql -U postgres pgtest < ~/dum.sql
.\psql.exe -h 127.71.160.31 -U postgres -d business -f D:\LinkSpace\Work\WorkFiles\Fcant\business.sql
#pg_restore导入数据库
pg_restore -h 192.168.0.100 -p 5432 -U postgres -W -d us2011 -v "/root/us2010.backup"

2、pg_dumpall

如果要备份Cluster中数据库共有的全局对象，例如角色和表空间，需要使用pg_dumpall。
备份文件以文本或存档文件格式输出。
Script dumps是一个普通文本文件，包含将数据库重构到保存时的状态所需的SQL命令。
要从这样的脚本恢复，需要将其提供给psql。脚本文件甚至可以用来在其他机器或者其他架构上重构数据库;进行一些必要的修改，甚至可以在其他数据库上使用。
pg_dumpall 在给定的群集中备份每个数据库, 并保留群集范围内的数据, 如角色和表空间定义。
pg_dumpall导出及psql恢复
```bash
pg_dumpall导出
su postgres #（需要切换到系统的postgres用户来进行备份） pg_dumpall > /backup/all_the_data.backup #（备份整个数据库集群）

psql恢复

su postgres psql -f /backup/all_the_data.backup postgres exit

<a name="Y7foN"></a>
## 3、pg_restore
PostgreSQL提供的一个工具pg_restore用来导入数据
<a name="QRVeL"></a>
### pg_restore恢复
```bash
#pg_restore恢复示例
pg_restore -h 192.168.0.100 -p 5432 -U postgres -W -d us2011 -v "/root/us2010.backup"

4、压缩方法

一般用dump导出数据会比较大，推荐使用xz压缩
压缩方法：

xz dum.sql

压缩后会生成 dum.sql.xz 的文件

xz压缩数据导入数据库方法

xzcat /data/dum.sql.xz | psql -h localhost -U postgres(用户名) 数据库名(缺省时同用户名)

5、附录

1.pg_dump工具参数

❯ .\pg_dump.exe --help
pg_dump 把一个数据库转储为纯文本文件或者是其它格式.
用法:
  pg_dump [选项]... [数据库名字]
一般选项:
  -f, --file=FILENAME          输出文件或目录名
  -F, --format=c|d|t|p         输出文件格式 (定制, 目录, tar
                               明文 (默认值))
  -j, --jobs=NUM               执行多个并行任务进行备份转储工作
  -v, --verbose                详细模式
  -V, --version                输出版本信息，然后退出
  -Z, --compress=0-9           被压缩格式的压缩级别
  --lock-wait-timeout=TIMEOUT  在等待表锁超时后操作失败
  --no-sync                    不用等待变化安全写入磁盘
  -?, --help                   显示此帮助, 然后退出
控制输出内容选项:
  -a, --data-only              只转储数据,不包括模式
  -b, --blobs                  在转储中包括大对象
  -B, --no-blobs               排除转储中的大型对象
  -c, --clean                  在重新创建之前，先清除（删除）数据库对象
  -C, --create                 在转储中包括命令,以便创建数据库
  -E, --encoding=ENCODING      转储以ENCODING形式编码的数据
  -n, --schema=PATTERN         dump the specified schema(s) only
  -N, --exclude-schema=PATTERN do NOT dump the specified schema(s)
  -O, --no-owner               在明文格式中, 忽略恢复对象所属者
  -s, --schema-only            只转储模式, 不包括数据
  -S, --superuser=NAME         在明文格式中使用指定的超级用户名
  -t, --table=PATTERN          dump the specified table(s) only
  -T, --exclude-table=PATTERN  do NOT dump the specified table(s)
  -x, --no-privileges          不要转储权限 (grant/revoke)
  --binary-upgrade             只能由升级工具使用
  --column-inserts             以带有列名的INSERT命令形式转储数据
  --disable-dollar-quoting     取消美元 (符号) 引号, 使用 SQL 标准引号
  --disable-triggers           在只恢复数据的过程中禁用触发器
  --enable-row-security        启用行安全性（只转储用户能够访问的内容）
  --exclude-table-data=PATTERN do NOT dump data for the specified table(s)
  --extra-float-digits=NUM     覆盖extra_float_digits的默认设置
  --if-exists                  当删除对象时使用IF EXISTS
  --include-foreign-data=PATTERN
                               include data of foreign tables on foreign
                               servers matching PATTERN
  --inserts                    以INSERT命令，而不是COPY命令的形式转储数据
  --load-via-partition-root    通过根表加载分区
  --no-comments                不转储注释
  --no-publications            不转储发布
  --no-security-labels         不转储安全标签的分配
  --no-subscriptions           不转储订阅
  --no-synchronized-snapshots  在并行工作集中不使用同步快照
  --no-tablespaces             不转储表空间分配信息
  --no-unlogged-table-data     不转储没有日志的表数据
  --on-conflict-do-nothing     将ON CONFLICT DO NOTHING添加到INSERT命令
  --quote-all-identifiers      所有标识符加引号，即使不是关键字
  --rows-per-insert=NROWS      每个插入的行数；意味着--inserts
  --section=SECTION            备份命名的节 (数据前, 数据, 及 数据后)
  --serializable-deferrable    等到备份可以无异常运行
  --snapshot=SNAPSHOT          为转储使用给定的快照
  --strict-names               要求每个表和(或)schema包括模式以匹配至少一个实体
  --use-set-session-authorization
                               使用 SESSION AUTHORIZATION 命令代替
                               ALTER OWNER 命令来设置所有权
联接选项:
  -d, --dbname=DBNAME      对数据库 DBNAME备份
  -h, --host=主机名        数据库服务器的主机名或套接字目录
  -p, --port=端口号        数据库服务器的端口号
  -U, --username=名字      以指定的数据库用户联接
  -w, --no-password        永远不提示输入口令
  -W, --password           强制口令提示 (自动)
  --role=ROLENAME          在转储前运行SET ROLE
如果没有提供数据库名字, 那么使用 PGDATABASE 环境变量
的数值.
Report bugs to <pgsql-bugs@lists.postgresql.org>.
PostgreSQL home page: <https://www.postgresql.org/>

2.pg_dumpall工具参数

❯ .\pg_dumpall.exe --help
pg_dumpall 抽取一个 PostgreSQL 数据库簇进一个 SQL 脚本文件.
用法:
  pg_dumpall [选项]...
一般选项:
  -f, --file=FILENAME          输出文件名
  -v, --verbose                详细模式
  -V, --version                输出版本信息，然后退出
  --lock-wait-timeout=TIMEOUT  在等待表锁超时后操作失败
  -?, --help                   显示此帮助, 然后退出
控制输出内容选项:
  -a, --data-only              只转储数据,不包括模式
  -c, --clean                  在重新创建数据库前先清除(删除)数据库
  -E, --encoding=ENCODING      转储以ENCODING形式编码的数据
  -g, --globals-only           只转储全局对象, 不包括数据库
  -O, --no-owner               不恢复对象所属者
  -r, --roles-only             只转储角色，不包括数据库或表空间
  -s, --schema-only            只转储模式, 不包括数据
  -S, --superuser=NAME         在转储中, 指定的超级用户名
  -t, --tablespaces-only       只转储表空间，而不转储数据库或角色
  -x, --no-privileges          不要转储权限 (grant/revoke)
  --binary-upgrade             只能由升级工具使用
  --column-inserts             以带有列名的INSERT命令形式转储数据
  --disable-dollar-quoting     取消美元 (符号) 引号, 使用 SQL 标准引号
  --disable-triggers           在只恢复数据的过程中禁用触发器
  --exclude-database=PATTERN   排除名称与PATTERN匹配的数据库
  --extra-float-digits=NUM     覆盖extra_float_digits的默认设置
  --if-exists                  当删除对象时使用IF EXISTS
  --inserts                    以INSERT命令，而不是COPY命令的形式转储数据
  --load-via-partition-root    通过根表加载分区
  --no-comments                不转储注释
  --no-publications            不转储发布
  --no-role-passwords          不转储角色的密码
  --no-security-labels         不转储安全标签的分配
  --no-subscriptions           不转储订阅
  --no-sync                    不用等待变化安全写入磁盘
  --no-tablespaces             不转储表空间分配信息
  --no-unlogged-table-data     不转储没有日志的表数据
  --on-conflict-do-nothing     将ON CONFLICT DO NOTHING添加到INSERT命令
  --quote-all-identifiers      所有标识符加引号，即使不是关键字
  --rows-per-insert=NROWS      每个插入的行数；意味着--inserts
  --use-set-session-authorization
                               使用 SESSION AUTHORIZATION 命令代替
                               ALTER OWNER 命令来设置所有权
联接选项:
  -d, --dbname=CONNSTR     连接数据库使用的连接串
  -h, --host=主机名        数据库服务器的主机名或套接字目录
  -l, --database=DBNAME    另一个缺省数据库
  -p, --port=端口号        数据库服务器的端口号
  -U, --username=名字      以指定的数据库用户联接
  -w, --no-password        永远不提示输入口令
  -W, --password           强制口令提示 (自动)
  --role=ROLENAME          在转储前运行SET ROLE
如果没有使用 -f/--file，那么将把SQL脚本写到标准输出.
Report bugs to <pgsql-bugs@lists.postgresql.org>.
PostgreSQL home page: <https://www.postgresql.org/>

3.pg_restore工具参数

❯ .\pg_restore.exe --help
pg_restore 从一个归档中恢复一个由 pg_dump 创建的 PostgreSQL 数据库.
用法:
  pg_restore [选项]... [文件名]
一般选项:
  -d, --dbname=名字        连接数据库名字
  -f, --file=文件名       输出文件名(- 对于stdout)
  -F, --format=c|d|t       备份文件格式(应该自动进行)
  -l, --list               打印归档文件的 TOC 概述
  -v, --verbose            详细模式
  -V, --version            输出版本信息, 然后退出
  -?, --help               显示此帮助, 然后退出
恢复控制选项:
  -a, --data-only              只恢复数据, 不包括模式
  -c, --clean                  在重新创建之前，先清除（删除）数据库对象
  -C, --create                 创建目标数据库
  -e, --exit-on-error          发生错误退出, 默认为继续
  -I, --index=NAME             恢复指定名称的索引
  -j, --jobs=NUM               执行多个并行任务进行恢复工作
  -L, --use-list=FILENAME      从这个文件中使用指定的内容表排序
                               输出
  -n, --schema=NAME            在这个模式中只恢复对象
  -N, --exclude-schema=NAME    不恢复此模式中的对象
  -O, --no-owner               不恢复对象所属者
  -P, --function=NAME(args)    恢复指定名字的函数
  -s, --schema-only            只恢复模式, 不包括数据
  -S, --superuser=NAME         使用指定的超级用户来禁用触发器
  -t, --table=NAME             恢复命名关系（表、视图等）
  -T, --trigger=NAME           恢复指定名字的触发器
  -x, --no-privileges          跳过处理权限的恢复 (grant/revoke)
  -1, --single-transaction     作为单个事务恢复
  --disable-triggers           在只恢复数据的过程中禁用触发器
  --enable-row-security        启用行安全性
  --if-exists                  当删除对象时使用IF EXISTS
  --no-comments                不恢复注释
  --no-data-for-failed-tables  对那些无法创建的表不进行
                               数据恢复
  --no-publications            不恢复发行
  --no-security-labels         不恢复安全标签信息
  --no-subscriptions           不恢复订阅
  --no-tablespaces             不恢复表空间的分配信息
  --section=SECTION            恢复命名节 (数据前、数据及数据后)
  --strict-names               要求每个表和(或)schema包括模式以匹配至少一个实体
  --use-set-session-authorization
                               使用 SESSION AUTHORIZATION 命令代替
                               ALTER OWNER 命令来设置所有权
联接选项:
  -h, --host=主机名        数据库服务器的主机名或套接字目录
  -p, --port=端口号        数据库服务器的端口号
  -U, --username=名字      以指定的数据库用户联接
  -w, --no-password        永远不提示输入口令
  -W, --password           强制口令提示 (自动)
  --role=ROLENAME          在恢复前执行SET ROLE操作
选项 -I, -n, -N, -P, -t, -T, 以及 --section 可以组合使用和指定
多次用于选择多个对象.
如果没有提供输入文件名, 则使用标准输入.
Report bugs to <pgsql-bugs@lists.postgresql.org>.
PostgreSQL home page: <https://www.postgresql.org/>

6、POSTGRES数据库导出导入的问题

A.编码问题

基础知识

需要关心3个字符集
1）一个是执行命令所在系统环境的字符集，如果是cygdrive，查看LANG默认是utf8，如果是powershell，用chcp命令结果为936，代表gbk。

2）一个是数据库server编码，在psql中运行 show server_encoding，结果为utf8。这个编码不太好改，而且官方文档说了不支持gbk（https://www.postgresql.org/docs/12/multibyte.html）。
3）一个是client编码，show client_encoding，结果是gbk。这个可以通过set client_encoding=xx来改变。

遇到的问题及解释

在powershell里使用pg_dump命令导出全库，然后再使用psql命令导入，遇到了gbk字符在utf8没有对应值的报错。
原因：通过vim查看导出文件编码，显示为utf-161e，不是utf8。虽然client编码是gbk，与文件一致，但是导入是要先经过server，因为与server编码不一致，所以报错。

解决方法及经验总结

将导出文件转码为utf8就可以导入了，但是数据的某些行导入时还有问题，会导致整个表数据不会插入。但这已经是最好的结果了。 :::tips 经验总结：以后导出文件时，应关注环境编码，在utf8环境下导出，比如使用cygdrive，或者将powershell的编码改成utf8（chcp 65001），这样导出文件编码就是utf8，与server编码相同，server又会将数据转码为client编码，导入时就不会有任何问题了。 :::

POSTGRESQL 数据库导入导出