设为首页 收藏本站
查看: 2719|回复: 0

[经验分享] 文件读取效率比较(Perl,Python,VBA)

[复制链接]

尚未签到

发表于 2015-12-27 14:32:54 | 显示全部楼层 |阅读模式
  测试样本:
  http://files.cnblogs.com/files/metree/TextSample.7z
  背景介绍:
  文本数据的处理是文本数据挖掘的第一步,本文展示了如何通过Perl,Python和VBA逐行读取文本文件(不打印输出),以下代码都添加了程序计时功能,主要用于对比各编程语言读取文本效率。
  测试环境:
  1)输入文件:读取94M文本文件。
  2)测试环境:
  a) 操作系统:Win7 64bit / SSD硬盘 / i7-4900MQ cpu @ 2.80GHz / 16G内存;
  b) Perl环境:Strawberry Perl 5.18.2.1-64bit;(同时电脑也安装了Cygwin 32bit);
  c) Python环境:Python 3.3.5;
  d) VBA环境:Excel2013 64bit, VBA7.0(测试时只保留一个excel文件处于打开状态,这点很重要!);
  测试结果:
  1)在Strawberry Perl 5.18.2.1-64bit和Cygwin 32bit下读取同样文件分别耗时0.162s0.128s
DSC0000.jpg DSC0001.jpg
  2)在Python3.3.5环境下,读取同样文本约耗时0.639s
DSC0002.jpg
  3)excel VBA文本空载逐行读取耗时2.855s
DSC0003.jpg
  通过以上测试:
  1) Cygwin环境下Perl的文本读取效率最高,为0.128s,VBA文本读取效率最低,为2.855s,两者相差20倍左右
  2) Cygwin环境下Perl的文本读取效率比Python3.3.5高约5倍
  3) 仅在文本读取效率方面,Perl语言优势明显。
  
  Perl逐行读取文本核心代码



use strict ;
use Time::HiRes qw(gettimeofday) ;
sub Test
{
# sec: seconds
# usec: microsecond
my ($start_sec, $start_usec) = gettimeofday() ;
#======================#
# Place your code here!#
#======================#

open MYFILE01,"/home/metree/a/CFGMML-RNC3014-192.168.1.9-20140408040026.txt" || die "cannot open the file: $!\n";
#======================#
    # Read text row by row #
    #======================#  
while (<MYFILE01>)
    {
#print;
$_ = <MYFILE01>;
#print $_;
    }
close MYFILE01;
my ($end_sec, $end_usec) = gettimeofday() ;
# Compute time elipsed
my $timeDelta = ($end_usec - $start_usec) / 1000 + ($end_sec - $start_sec) * 1000;
print $timeDelta;
}
&Test() ;
1 ;
  Python逐行读取文本核心代码



import datetime
starttime = datetime.datetime.now()

#===================#
# do something here #
#===================#

f = open("d:\CFGMML-RNC3014-192.168.1.9-20140408040026.txt","r")
line = f.readline()
while line:
#print (line)
line = f.readline()

f.close
endtime = datetime.datetime.now()
interval=endtime - starttime
print (interval)
  VBA逐行读取文本核心代码



Sub VBAtextReadline()
Dim FileToOpenCsv
Dim Begin
Dim Over
Dim fso_SeqCsv
FileToOpenCsv = Application.GetOpenFilename("CSV文档(*.*),*.*", 1, "请选择需要导入的csv文件", , True)
If Not IsArray(FileToOpenCsv) Then
MsgBox "未选择任何文件!"
Exit Sub
End If
'开始计时
Begin = Timer
Const ForReading = 1
Const ForWriting = 2
Const ForAppending = 8        
i = 0 '统计文本总行数
   
Application.ScreenUpdating = False
Application.DisplayAlerts = False
Set fso_SeqCsv = CreateObject("Scripting.FileSystemObject")
For i_FilesNumCsv = LBound(FileToOpenCsv) To UBound(FileToOpenCsv)        
Set SeqCsvFiles = fso_SeqCsv.OpenTextFile(FileToOpenCsv(i_FilesNumCsv), ForReading, True, TristateTrue)        
Do While Not SeqCsvFiles.AtEndOfLine            
SeqAlarm_Line = SeqCsvFiles.ReadLine
'pmSglAlarmAll = Split(SeqAlarm_Line, Chr(44), -1)
i = i + 1            
Loop
Next

Application.ScreenUpdating = True
Application.DisplayAlerts = True   

Over = Timer
MsgBox ("已运行完成!共运行" & Over - Begin & "s。" & "  " & i)
End Sub

运维网声明 1、欢迎大家加入本站运维交流群:群②:261659950 群⑤:202807635 群⑦870801961 群⑧679858003
2、本站所有主题由该帖子作者发表,该帖子作者与运维网享有帖子相关版权
3、所有作品的著作权均归原作者享有,请您和我们一样尊重他人的著作权等合法权益。如果您对作品感到满意,请购买正版
4、禁止制作、复制、发布和传播具有反动、淫秽、色情、暴力、凶杀等内容的信息,一经发现立即删除。若您因此触犯法律,一切后果自负,我们对此不承担任何责任
5、所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其内容的准确性、可靠性、正当性、安全性、合法性等负责,亦不承担任何法律责任
6、所有作品仅供您个人学习、研究或欣赏,不得用于商业或者其他用途,否则,一切后果均由您自己承担,我们对此不承担任何法律责任
7、如涉及侵犯版权等问题,请您及时通知我们,我们将立即采取措施予以解决
8、联系人Email:admin@iyunv.com 网址:www.yunweiku.com

所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其承担任何法律责任,如涉及侵犯版权等问题,请您及时通知我们,我们将立即处理,联系人Email:kefu@iyunv.com,QQ:1061981298 本贴地址:https://www.yunweiku.com/thread-157012-1-1.html 上篇帖子: Solved problems updating perl-XML-SAX-0.96-7.el6.noarch on CentOS 6 下篇帖子: 《使用Mason在HTML页面中嵌入Perl》(节选)
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

扫码加入运维网微信交流群X

扫码加入运维网微信交流群

扫描二维码加入运维网微信交流群,最新一手资源尽在官方微信交流群!快快加入我们吧...

扫描微信二维码查看详情

客服E-mail:kefu@iyunv.com 客服QQ:1061981298


QQ群⑦:运维网交流群⑦ QQ群⑧:运维网交流群⑧ k8s群:运维网kubernetes交流群


提醒:禁止发布任何违反国家法律、法规的言论与图片等内容;本站内容均来自个人观点与网络等信息,非本站认同之观点.


本站大部分资源是网友从网上搜集分享而来,其版权均归原作者及其网站所有,我们尊重他人的合法权益,如有内容侵犯您的合法权益,请及时与我们联系进行核实删除!



合作伙伴: 青云cloud

快速回复 返回顶部 返回列表