ORA-01578 错误:”ORACLE data block corrupted(file # %s, block # %s)”:

块损坏故障现象:ORA-01578

一般情况下,ORA-01578 错误是由硬件问题引起的。如果ORA-01578 错误始终返回
相同的参数,则最可能的原因是块介质损坏。
如果返回的参数每次都有变化,则可能存在硬件问题。应检查内存和页面空间,并检查
I/O 子系统,以便查找有问题的控制器。
注:ORA-01578 返回相对文件号,但伴随出现的ORA-01110 错误会显示绝对文件号。

如何处理损坏

检查预警日志和操作系统日志文件。
• 使用可用的诊断工具,找出损坏的类型。
• 多次运行检查功能,确定错误是否持续存在。
• 根据需要,从损坏的对象中恢复数据。
• 解决硬件问题:
– 内存条
– 磁盘控制器
– 磁盘
• 根据需要,从损坏的对象中恢复或还原数据

设置检测损坏的参数

EM > Server(服务器)> Initialization Parameters(初始化参数)
可以使用DB_ULTRA_SAFE 参数来简化管理。它会影响下列参数的默认值:
• DB_BLOCK_CHECKING,用于启动对数据库块的检查。此检查通常可防止内存和数据
损坏。(默认值:FALSE,建议值:FULL)
• DB_BLOCK_CHECKSUM,将每个数据块写入到磁盘时,在其高速缓存标头中启动校验
和的计算和存储。校验和有助于检测由基础磁盘、存储系统或I/O 系统引起的损坏。
(默认值:TYPICAL,建议值:TYPICAL)
• DB_LOST_WRITE_PROTECT,用于启动对“丢失的写入”的检查。如果I/O 子系统
指示块写入已完成,但该块尚未完全写入到持久存储中,则物理备用数据库上会发生
数据块写入丢失。
image.png

  1. SQL> show parameters db_block
  2. NAME TYPE VALUE
  3. ------------------------------------ ----------- ------------------------------
  4. db_block_buffers integer 0
  5. db_block_checking string FALSE
  6. db_block_checksum string TYPICAL
  7. db_block_size

物理/介质损坏:数据库无法识别块:校验和无效、块内容全部为零或者块标头不完整。
物理损坏检查是默认启用的。
逻辑损坏:块的校验和有效,块头和块尾也匹配,但是内容不一致。块介质恢复不能
修复逻辑块损坏。默认情况下,逻辑损坏检查处于禁用状态。通过指定BACKUP、
RESTORE、RECOVER 和VALIDATE 命令的CHECK LOGICAL 选项,可以启用逻辑损
坏检查

手动添加坏块

1.查看表所处的块

  1. select distinct --dbms_rowid.rowid_object(rowid),
  2. dbms_rowid.rowid_relative_fno(rowid),
  3. dbms_rowid.rowid_block_number(rowid)
  4. --dbms_rowid.rowid_row_number(rowid)
  5. from hr.employees

2.到数据文件目录下

  1. cd /opt/oracle/oradata/ORCLCDB/
  2. dd if=users01.dbf of=test.dbf bs=8192 count=1 skip=110038 conv=notrunc提取块
  3. dd if=/dev/zero of=users01.dbf bs=8192 count=1 seek=110038 conv=notrunc 制造坏块

块介质恢复的先决条件

下列先决条件适用于RECOVER … BLOCK 命令:
• 目标数据库必须以ARCHIVELOG 模式运行,并且必须是打开的,或是使用当前控制
文件装载的。
• 包含损坏块的数据文件备份必须是完全备份或0 级备份,不能是代理副本。如果只存
在代理副本备份,则可将它们还原到磁盘上的非默认位置;在这种情况下,RMAN
会认为它们是数据文件副本,在块介质恢复过程中会在其中搜索块。
• RMAN 只能使用归档重做日志进行恢复。RMAN 不能使用1 级增量备份。块介质恢
复不能恢复丢失或无法访问的归档重做日志,但有时可以恢复丢失的重做记录。
• 必须在目标数据库上启用闪回数据库,这样RMAN 才能在闪回日志中搜索损坏块的
好副本。如果启用了闪回日志记录,而且该日志记录包含损坏块的较旧但未损坏的版
本,则RMAN 可以使用这些块,因而可能会提高恢复的速度。

1.手动恢复

  1. RECOVER DATAFILE 6 BLOCK 3;
  2. ----------------------------------------
  3. Recover a single block
  4. RECOVER
  5. DATAFILE 2 BLOCK 43
  6. DATAFILE 2 BLOCK 79
  7. DATAFILE 6 BLOCK 183;
  8. recover datafile 7 block 110038, 164917;
  9. -----------------------------------------
  10. Recover multiple blocks in multiple data files
  11. RECOVER CORRUPTION LIST;
  12. Recover all blocks logged in

2.恢复指导

  1. RMAN> validate tablespace users;
  2. RMAN> list failure
  3. 2> ;
  4. using target database control file instead of recovery catalog
  5. Database Role: PRIMARY
  6. List of Database Failures
  7. =========================
  8. Failure ID Priority Status Time Detected Summary
  9. ---------- -------- --------- ------------- -------
  10. 3261 HIGH OPEN 22-SEP-19 Datafile 7: '/opt/oracle/oradata/ORCLCDB/users01.dbf' contains one or more corrupt bl
  11. ocks
  12. RMAN> advise failure
  13. 2> ;
  14. Database Role: PRIMARY
  15. List of Database Failures
  16. =========================
  17. Failure ID Priority Status Time Detected Summary
  18. ---------- -------- --------- ------------- -------
  19. 3261 HIGH OPEN 22-SEP-19 Datafile 7: '/opt/oracle/oradata/ORCLCDB/users01.dbf' contains one or more corrupt bl
  20. ocks
  21. analyzing automatic repair options; this may take some time
  22. allocated channel: ORA_DISK_1
  23. channel ORA_DISK_1: SID=266 device type=DISK
  24. analyzing automatic repair options complete
  25. RMAN> repair failure preview
  26. 2> ;
  27. Strategy: The repair includes complete media recovery with no data loss
  28. Repair script: /opt/oracle/diag/rdbms/orclcdb/ORCLCDB/hm/reco_2744205325.hm
  29. contents of repair script:
  30. # block media recovery
  31. recover datafile 7 block 110038;
  32. RMAN> repair failure;

3.屏蔽块

  1. 块屏蔽:
  2. 没有备份的话,可以屏蔽坏块,其他块不影响。
  3. exec dbms_repair.skip_corrupt_blocks('FX','FXTBS');
  4. select skip_corrupt from dba_tables where table_name='FXTBS'