weiliwei 发表于 2017-5-17 10:34:50

Perl处理输入输出-1

  声明:本神奇的Perl系列为刘兴(http://deepfuture.iteye.com/)原创,未经笔者授权,任何人和机构不能转载
1.第一个Perl任务

我们先放松想像一下:你是公司一个普通的开发人员,一大早,阳光明媚,你急不可待打开QQ,跟最近泡上的MM聊天。此时项目组长急勿勿过来了,交给你一个紧急任务,将perl1-2.txt中的人员按城市分别存为几个文本文件,文件名是城市名,文本内容如下:
  刘欢欢,20,长沙#冯军,25,上海#李兵,21,北京#李军,23,北京#李志,27,北京#黄王兵,29,长沙#赵兵,22,上海#李强兵,25,上海。。。。。。。
你不禁倒吸一口凉气,天呀,又要编写一大堆代码来完成这个任务,而且还要读写文件,好久没操作文件IO了,有些命令都忘了。你也许足够聪明,想到干脆把perl1-2.txt导入到数据库中,然后运行SQL查询,按城市生成不同的表再导出,很快你打消这个念头,工作量大,如果城市众多,手工将生成的表导出几乎不可能。用C、C++、Pascal、java等高级语言确实完成这个任务,但代码量较大,使用Perl,10多行就能搞定。请允许我在此卖个关子,我们先了解一下Perl的输入输出基础,回头再来解决这个任务。
Perl语言具有以下基本特点:
  1、Perl用#表示后面的内容为注释。
  2、Perl语句用;表示结束。
  3、Perl程序通常以pl结尾,如果是做为Apache容器中的cgi程序来执行脚本,必须为脚本文件名提供.pl或.cgi扩展名。
  4、Perl对变量的表示方式非常简洁:
  1)Perl不要求变量有类型。
  2)对于数组、列表,采用以@后接变量名表示,比如@names。
  3)对于保存单个值的变量,采用$后接变量名表示,称之为标量,比如$name。
  4)对于哈希变量,采用%后接变量名表示。
  5、你可以选择这种方式执行Perl程序,在命令行中输入:
perl 程序名
2.Perl的文件处理原则 

      Perl的文件处理很简单,只需掌握以下2个原则:
     1、打开文件使用open,关闭文件使用close,使用print向文件输出内容。
     2、>表示写,<表示读,>>表示在原有内容上增加,Perl使用这几个符号来表示对文件的处理方式。
     比如:
     1)读取文件(FH表示文件句柄,以下几个例子均是):
     open (FH,“<文件名”);
     2)写入文件,写入之前,如果文件已经存在,则删除它,重新建立一个新的。
     open (FH,“>文件名”);
     3)打开一个文件并增加内容。如果文件不存在,则建立一个文件再打开。如果已经存在则直接打开。
     Open (FH,”>>文件名”);
     3、关闭一个文件
     Close (FH);
 3.读取文本文件

  我们首先试试看能不能按每人每行来读取并显示文件内容
     use 5.010;
     open FH,'<.\perl1-2.txt';
     $mytext=<FH>;
     @peoples=split '#',$mytext;
foreach  $people(@peoples){
      say $people;
   }
   close FH;
    运行一下,效果不错
   刘欢欢,20,长沙
 冯军,25,上海
 李兵,21,北京
 李军,23,北京
 李志,27,北京
 黄王兵,29,长沙
 赵兵,22,上海
 李强兵,25,上海
   我们来解释一下这段perl程序:
   第1行:use后接perl的版本号,表示使用perl5.1。
   第2行:打开一个文件,并给予一个文件句柄,Perl对文件的处理方式是操作文件句柄,而不直接操作文件名,你可以把它理解为一个文件的别名。根据Perl的文件处理的第2个原则,perl1-2.txt表示处理的文件名,<是处理方式为读取。open的调用方式为open 句柄,处理方式后接文件名
第3行:这一行表示打开FH文件句柄所代表的文件,然后,把文件内容赋值给$mytext变量。
第4行:从变量名的前缀@可以看出@peoples是一个数组,那么split('#', $mytext)是什么?split是一个函数,这个函数的功能是从$mytext变量的文本中取得被#分割的部分,即每个人的具体情况,每个部分做为数组的一个元素。
第5行:foreach表示从一个循环,在循环中每次从@peoples数组中取得一个元素值给$people,
第6行:循环体,唯一的任务就是将每个取得的元素打印出来,因为这些元素已经放在$people中了。say和print的不同之处在于:say在输出时会在结尾处加上一个换行,print不会。如果使用print,可以将say $people;改成print “$people\n”;
细心的你一定发现了 “$people\n”这种写法,$people不是变量名吗,怎么能直接放在双引号中呢,Perl管这个叫变量内插,在双引号的变量最后会以变量值表示。
第7行:循环结束
第8行:表示关闭文件句柄FH。
4.单引号与双引号

等等,还有问题,单引号呢?除了双引号,单引号也可以表示字符串呀,答案是单引号内的变量不会内插,会直接以变量名表示。最后一个小提示,在Perl字符串的连接可以使用小数点符号.解决。如:“hello,”.’”’world”表示’”’helloworld”。
这节结束之前我们把上面代码改一下,看看单引号和双引号的区别:
   use 5.010;
   $|=1;
   open FH,'<.\perl1-2.txt';
   $mytext=<FH>;
   @peoples=split '#',$mytext;
   foreach  $people(@peoples){
      print '$people:'."$people\n";
   }
   close FH;
从以下运行结果可以看出,单引号直接将变量名显示出来了。
$people:刘欢欢,20,长沙
$people:冯军,25,上海
$people:李兵,21,北京
$people:李军,23,北京
$people:李志,27,北京
$people:黄王兵,29,长沙
$people:赵兵,22,上海
$people:李强兵,25,上海
 从上面程序中,你也许看出来了:
 
   1、“=”这个符号太神奇了,后面接文件句柄,就能读取文件
  $mytext=<FH>;
  但是,上面这个语句只适于文件只有一行的情况(所谓一行是指从行首一直到换行符为止),因为$mytext是标量,只能保存一个元素。 文件超过一行,应使用数组方式:
   @myext=<FH>;#Perl返回所有内容给@mytext,数组每个元素是文件的一行。
 
   2、foreach更神奇了,可以自动从数组中抽取元素。
   foreach  $people(@peoples){
      say $people;
   }
5.小试牛刀

   学以致用,我们尝试一下:读取ActivePerl目录下的Copyright.html。
 
  #perl1-4.pl
  #笔者的ActivePerl安装在d盘下
  use 5.010;
  open FH,'<D:/Perl/html/Copyright.html';
  @mytexts=<FH>;
 
  foreach  $mytext(@mytexts){
    print $mytext;
  }
 
  网页文件成功显示了:
 
 <!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.0  Transitional//EN">
 
<html>
 
<head>
<!-- saved from url=(0017)http://localhost/ -->
<script language="JavaScript" src="./displayToc.js"></script>
<script language="JavaScript" src="./tocParas.js"></script>
<script language="JavaScript" src="./tocTab.js"></script>
<title>Welcome to ActivePerl</title>
<link rel="stylesheet" href="Active.css" type="text/css">
</head>
    
页: [1]
查看完整版本: Perl处理输入输出-1