cf2000 发表于 2015-6-16 11:53:04

oracle坏块修复处理#ocp试验#

  坏块分为物理坏块和逻辑坏块,前者是硬件问题产生,后者是oracle内部数据有问题,本次试验针对后者。
  
需要归档模式,步骤



1 create tablespace test 1m (table t1, insert)
2 RMAN>backup tablespace test
3 模拟坏块
4 DBV
5 ANALYZE TABLE
6 RMAN BACKUP
7 EXP
8 DBMS_REPAIR
9 BLOCKRECOVER
  1,sys用户下创建表空间
  SYS@jsce>create tablespace tbs1 datafile 'e:\tbs1.dbf' size 1m; --大小1M,容易填满(现在突然有疑惑:为什么要填满,才能制造坏块?)
  在tbs1中创建表tb1,数据来源是scott.emp
  SYS@jsce>create table tb1 tablespace tbs1 as select * from scott.emp;
  双倍递增插入表tb1,来源也是其自己
  SYS@jsce>insert into tb1 select * from tb1; --这里是select出来的东西插入到表,没有关键字values
  已创建15行。
  SYS@jsce>insert into tb1 select * from tb1;
  已创建30行。
  SYS@jsce>insert into tb1 select * from tb1;
  已创建60行。
  
  
  
  
  在插满之后,不要忘记commit,否则oracle不能shutdown,最后确认一下插入的数据量“15360”
  
  》给表增加索引,后面查询有坏块之后,坏块带来损失的数据ORPHAN_TABLE;
  SYS@jsce>create index i1 on tb1(ename);
  索引已创建。
  SYS@jsce>alter system checkpoint; --这一步是将插入的数据作检查点写入数据文件,下一步就要通过ultraedit修改数据文件,制造坏块。
  系统已更改。
  备注:如果表字段没有设置not null必输项,并且表字段很多,那么可以指定字段来插入一部分,比如emp表
  insert into emp(empno,ename,sal) values(22,'sumsen',8900);
  2,rman备份表空间tbs1,得到优良备份(下面还原使用)
  RMAN> backup tablespace tbs1 tag=ok;--增加tag

  3,shutdown之后,通过ultraedit修改数据文件 --修改的时候不要开头部,那里是数据文件名称,有可能导致oracle启动失败

  修改,保存之后,数据文件目录会多出一个TBS1.DBF.bak,说明修改过了,不知道为何

  启动oracle再次查询报错,坏块产生 --这里的select 是遇到第一个坏块就报错,因此如果有多个坏块,也是报出一个错误信息,需要用下面的REPAIR_TABLE查询所有的坏块。

  4,用dbv检测


  这里仅仅给出坏块数,没有给出坏块号和文件号
  5,使用 ANALYZE TABLE
  SYS@jsce>analyze table tb1 validate structure;

  6,rman的备份和exp导出有坏块的表空间
  exp导出sys下的

  E:\Documents and Settings\xs>exp userid='sys/sys as sysdba' file=e:\exptbs1.dmp tablespaces=tbs1
  导出表空间没有问题

  导出表有坏块报错

  rman提示超过坏块限制

  通过设置坏块最大数来继续备份
  RMAN> run{set maxcorrupt for datafile 3 to 10;backup tablespace tbs1 tag=bad;} 要写在一块,让rman知道是一个事务
  因为最大坏块设置为了10,tbs1有两个坏块,可以通过备份

  7,包DBMS_REPAIR
  exec DBMS_REPAIR.ADMIN_TABLES('REPAIR_TABLE',1,1,'USERS');--表数据
  exec DBMS_REPAIR.ADMIN_TABLES('ORPHAN_TABLE',2,1,'USERS');--索引数据

  检查坏块:dbms_repair.check_object , 这里的schema_name是用户,比如我在sys下建立的表空间,这里就是sys,
  object_name是表不是表空间(查询的时候报错也是通过select * from tb1)
  declare
   cc number;
   begin
   dbms_repair.check_object(schema_name => 'SYS',object_name => 'TB1',corrupt_count => cc);
   dbms_output.put_line(a => to_char(cc)); --这里a=>不明不白,可以去掉
   end;

  
看到这里用dbms_repair.check,检查的结果corrupt_count=2,有2个块损坏,和dbv的结果一致。
check完之后,在我们刚在创建的REPAIR_TABLE中查看块损坏详细信息:




SELECT object_name,
relative_file_id,
block_id,
marked_corrupt,
corrupt_description,
repair_description,
CHECK_TIMESTAMP
from repair_table;
  得到4个结果,不过就两个块(33,69),只是时间不一样,不解?

  我们注意看MARKED_CORRUPT的值,这里经过check_object后,已经标识为TRUE了。(?)
  》使用包的skip_corrupt_blocks过程来跳过坏块
  exec dbms_repair.skip_corrupt_blocks(schema_name => 'SYS',object_name => 'TB1',flags => 1);

  损失了15360-15020=340 条数据
  》处理index上的无效键值;dump_orphan_keys
  declare
    cc number;
   begin
      dbms_repair.dump_orphan_keys(schema_name => 'SYS',object_name => 'I1',object_type => 2,
   repair_table_name => 'REPAIR_TABLE',orphan_table_name => 'ORPHAN_TABLE',key_count => CC);
    end;
  之后查询数据,我们根据这个结果来考虑是否需要rebuild index(?)

  和上面的损失数目一样
  9BLOCKRECOVER 恢复坏块--前提是坏块事先有备份
  RMAN> blockrecover from tag=ok datafile 3 block 33,69;--必须要指定坏块号

  之后查询tb1,恢复

  这时候dbv检测也为0

  
  18:10 更新,使用oracle内部事件
  再次破坏了数据文件,可是查询时候仍然不报错,想到是前面执行了让oracle跳过坏块的过程
  exec dbms_repair.skip_corrupt_blocks(schema_name => 'SYS',object_name => 'TB1',flags => 1);

  直接将flag=>2


  SELECT tablespace_name, segment_type, owner, segment_name
         FROM dba_extents
          WHERE file_id = 3
          and 35 between block_id AND block_id + blocks - 1 --这里 35 between不懂

  ALTER SYSTEM SET EVENTS='10231 trace name context forever,level 10' ;


  之后
  SQL> ALTER SYSTEM SET EVENTS='10231 trace name context off' ;
  系统已更改。
  删除表空间
  SYS@jsce>drop tablespace tbs1 including contents and datafiles; --表空间物理文件也被删除
  之后导入
  演示省略。
  
  
  
页: [1]
查看完整版本: oracle坏块修复处理#ocp试验#