elixiat 发表于 2017-5-18 07:56:55

Perl模块之Tie::File

  原文:http://hi.baidu.com/mylongwalk/blog/item/004df0220cc2cc4dad34dea0.html
  perl的Tie::File模块真是与乎寻常的强大
  Tie::File:  
             Tie::File - Access the lines of a disk file via a Perl array: 将一个file和array tie起来,对array所做的任何操作都会同步反映到file上,等同于对文件进行了操作。
  注意:Tie::File模块不适用于处理存放大量短小记录的文件!!
  这里所说的记录型文件,是指文件读写时的最小单位是记录而不是通常的字节。数据记录之间以记录分隔符隔开,故要求文件有效数据的内容不会与记录分隔符相混淆。通常我们使用的文本文件就属于记录型文件,它的记录分隔符在win32下是\r\n序列,在unix下则是\n。对于记录型文件,Perl提供了一个模块Tie::File将文件同一个数组关联起来,对数组进行操作就等价于对文件本身进行操作,数组内容所有的改变都会立即反映在文件中。更令人兴奋的是同文件相关的这个数组是一个“虚拟”数组,本身并不会占用多少空间,因此即使操作数以GB计的文件也十分轻松。其用法如下:
  use strict;                                                                      
use warnings;                                                                    
use Tie::File;                                                                   
  my @lines; # 文件关联数组                                                        
my $filename='./test.dat'; # 记录文件名                                          
  tie(@lines,'Tie::File',$filename) or die; # 将记录文件同数组关联,默认为文本型文件
                                          # 记录分隔符使用"\r\n"或"\n"           
  $lines="Hello"; # 这里对数组内容的操作就直接反映到文件中去了                  
$lines="world!"; # 增加一条新记录                                             
splice(@lines,1,0,"insert another line"); # 在老记录之间插入记录                                                     
delete $lines; # 删除记录                                                     
  untie(@lines); # 解除文件同数组的关联                                            
  这就是对文本文件的一系列操作,可以看出该模块使用起来十分灵活简便。除此之外模块还有几个选项可以调整细节行为,常用选项如下:
      1. recsep
    类似于$/, 用来指定记录分隔符,分隔符可以是任意字符串。每条记录都不包含分隔符,但写入文件时都会自动附加上一个记录分隔符,如果记录内容本身已经附加有分隔符则会忽略。读出记录内容时会自动去除分隔符(由autochomp选项控制)。默认的记录分隔符是"\r\n"或"\n",我们可以任意改变它以适应自己的需求。唯一需要注意的地方就是记录分隔符不可与有效数据内容混淆,也不能为空(没有记录分隔符就谈不上记录型文件了)。            
         tie (@array, 'Tie::File', $file, recsep => 'es');
This says that records are delimited by the string es . If the file contained the following data:
         Curse these pesky flies!\n
then the @array would appear to have four elements:
1."Curse th"
2 ."e p"
3."ky fli"
4."!\n"
      2. autochomp
    指定读出记录时是否去除记录分隔符,(默认)为真值时会自动去除分隔符。如:
     Normally, array elements have the record separator removed, so that if the file contains the text


[*]Gold
[*]Frankincense
[*]Myrrh

  the tied array will appear to contain ("Gold", "Frankincense", "Myrrh")(不包括换行)If you set   autochomp to a false value, the record separator will not be removed. If the file above was tied with


[*]
tie (@gifts, "Tie::File", $gifts, autochomp => 0);

  then the array @gifts would appear to contain ("Gold\n", "Frankincense\n", "Myrrh\n") , or (on Win32 systems) ("Gold\r\n", "Frankincense\r\n", "Myrrh\r\n") .      
   3. splice
     spice是perl命令,不是此模块所独有,用法如下:
    splice ARRAY,OFFSET,LENGTH,LIST
splice ARRAY,OFFSET,LENGTH
splice ARRAY,OFFSET
    splice ARRAY    
    从第offset个元素开始,删除长度为length个元素,若list存在,则 用list代替删除掉的数据(若lenght=0,则变成了添加)。若省略length,则删除从offset开始的所有数据。offset和 length都省略则删除所有元素。
  除此之外还有mode、memory、dw_size等选项。另外在指定选项时可以在选项前加一个“-”号,即tie(...,-recsep=& gt;...)和tie(...,recsep=>...)这两种形式是等价的。对该模块的进一步说明请参考perldoc Tie::File
http://perldoc.perl.org/Tie/File.html
页: [1]
查看完整版本: Perl模块之Tie::File