oracle坏块修复处理#ocp试验#

cf2000 发表于 2015-6-16 11:53:04

　　坏块分为物理坏块和逻辑坏块，前者是硬件问题产生，后者是oracle内部数据有问题，本次试验针对后者。
　　
需要归档模式，步骤

1 create tablespace test 1m (table t1, insert)
2 RMAN>backup tablespace test
3 模拟坏块
4 DBV
5 ANALYZE TABLE
6 RMAN BACKUP
7 EXP
8 DBMS_REPAIR
9 BLOCKRECOVER
　　1，sys用户下创建表空间
　　SYS@jsce>create tablespace tbs1 datafile 'e:\tbs1.dbf' size 1m; --大小1M，容易填满（现在突然有疑惑：为什么要填满，才能制造坏块？）
　　在tbs1中创建表tb1，数据来源是scott.emp
　　SYS@jsce>create table tb1 tablespace tbs1 as select * from scott.emp;
　　双倍递增插入表tb1，来源也是其自己
　　SYS@jsce>insert into tb1 select * from tb1; --这里是select出来的东西插入到表，没有关键字values
　　已创建15行。
　　SYS@jsce>insert into tb1 select * from tb1;
　　已创建30行。
　　SYS@jsce>insert into tb1 select * from tb1;
　　已创建60行。
　　
　　
　　
　　
　　在插满之后，不要忘记commit，否则oracle不能shutdown，最后确认一下插入的数据量“15360”
　　
　　》给表增加索引，后面查询有坏块之后，坏块带来损失的数据ORPHAN_TABLE;
　　SYS@jsce>create index i1 on tb1(ename);
　　索引已创建。
　　SYS@jsce>alter system checkpoint; --这一步是将插入的数据作检查点写入数据文件，下一步就要通过ultraedit修改数据文件，制造坏块。
　　系统已更改。
　　备注：如果表字段没有设置not null必输项，并且表字段很多，那么可以指定字段来插入一部分，比如emp表
　　insert into emp(empno,ename,sal) values(22,'sumsen',8900);
　　2，rman备份表空间tbs1，得到优良备份（下面还原使用）
　　RMAN> backup tablespace tbs1 tag=ok;--增加tag

　　3，shutdown之后，通过ultraedit修改数据文件 --修改的时候不要开头部，那里是数据文件名称，有可能导致oracle启动失败

　　修改，保存之后，数据文件目录会多出一个TBS1.DBF.bak，说明修改过了，不知道为何

　　启动oracle再次查询报错，坏块产生 --这里的select 是遇到第一个坏块就报错，因此如果有多个坏块，也是报出一个错误信息，需要用下面的REPAIR_TABLE查询所有的坏块。

　　4，用dbv检测

　　这里仅仅给出坏块数，没有给出坏块号和文件号
　　5，使用 ANALYZE TABLE
　　SYS@jsce>analyze table tb1 validate structure;

　　6，rman的备份和exp导出有坏块的表空间
　　exp导出sys下的

　　E:\Documents and Settings\xs>exp userid='sys/sys as sysdba' file=e:\exptbs1.dmp tablespaces=tbs1
　　导出表空间没有问题

　　导出表有坏块报错

　　rman提示超过坏块限制

　　通过设置坏块最大数来继续备份
　　RMAN> run{set maxcorrupt for datafile 3 to 10;backup tablespace tbs1 tag=bad;} 要写在一块，让rman知道是一个事务
　　因为最大坏块设置为了10，tbs1有两个坏块，可以通过备份

　　7，包DBMS_REPAIR
　　exec DBMS_REPAIR.ADMIN_TABLES('REPAIR_TABLE',1,1,'USERS');--表数据
　　exec DBMS_REPAIR.ADMIN_TABLES('ORPHAN_TABLE',2,1,'USERS');--索引数据

　　检查坏块：dbms_repair.check_object ，这里的schema_name是用户，比如我在sys下建立的表空间，这里就是sys，
　　object_name是表不是表空间（查询的时候报错也是通过select * from tb1）
　　declare
cc number;
begin
dbms_repair.check_object(schema_name => 'SYS',object_name => 'TB1',corrupt_count => cc);
dbms_output.put_line(a => to_char(cc)); --这里a=>不明不白，可以去掉
end;

　　
看到这里用dbms_repair.check，检查的结果corrupt_count＝2，有2个块损坏，和dbv的结果一致。
check完之后，在我们刚在创建的REPAIR_TABLE中查看块损坏详细信息：

SELECT object_name,
relative_file_id,
block_id,
marked_corrupt,
corrupt_description,
repair_description,
CHECK_TIMESTAMP
from repair_table;
　　得到4个结果，不过就两个块（33,69），只是时间不一样，不解？

　　我们注意看MARKED_CORRUPT的值，这里经过check_object后，已经标识为TRUE了。（？）
　　》使用包的skip_corrupt_blocks过程来跳过坏块
　　exec dbms_repair.skip_corrupt_blocks(schema_name => 'SYS',object_name => 'TB1',flags => 1);

　　损失了15360-15020=340 条数据
　　》处理index上的无效键值；dump_orphan_keys
　　declare
cc number;
begin
   dbms_repair.dump_orphan_keys(schema_name => 'SYS',object_name => 'I1',object_type => 2,
repair_table_name => 'REPAIR_TABLE',orphan_table_name => 'ORPHAN_TABLE',key_count => CC);
end;
　　之后查询数据，我们根据这个结果来考虑是否需要rebuild index（？）

　　和上面的损失数目一样
　　9BLOCKRECOVER 恢复坏块--前提是坏块事先有备份
　　RMAN> blockrecover from tag=ok datafile 3 block 33,69;--必须要指定坏块号

　　之后查询tb1，恢复

　　这时候dbv检测也为0

　　
　　18:10 更新，使用oracle内部事件
　　再次破坏了数据文件，可是查询时候仍然不报错，想到是前面执行了让oracle跳过坏块的过程
　　exec dbms_repair.skip_corrupt_blocks(schema_name => 'SYS',object_name => 'TB1',flags => 1);

　　直接将flag=>2

　　SELECT tablespace_name, segment_type, owner, segment_name
      FROM dba_extents
      WHERE file_id = 3
      and 35 between block_id AND block_id + blocks - 1 --这里 35 between不懂

　　ALTER SYSTEM SET EVENTS='10231 trace name context forever,level 10' ;

　　之后
　　SQL> ALTER SYSTEM SET EVENTS='10231 trace name context off' ;
　　系统已更改。
　　删除表空间
　　SYS@jsce>drop tablespace tbs1 including contents and datafiles; --表空间物理文件也被删除
　　之后导入
　　演示省略。
　　
　　
　　

页: [1]

运维网's Archiver

oracle坏块修复处理#ocp试验#