设为首页 收藏本站
查看: 827|回复: 0

[经验分享] 大熊君大话NodeJS之------Buffer模块

[复制链接]

尚未签到

发表于 2017-2-22 11:19:07 | 显示全部楼层 |阅读模式
  一,开篇分析
  所谓缓冲区Buffer,就是 "临时存贮区" 的意思,是暂时存放输入输出数据的一段内存。
  JS语言自身只有字符串数据类型,没有二进制数据类型,因此NodeJS提供了一个与String对等的全局构造函数Buffer来提供对二进制数据的操作。除了可以读取文件得到Buffer的实例外,还能够直接构造,例如:
   var buffer = new Buffer([ 0x68, 0x65, 0x6c, 0x6c, 0x6f ]) ;
  Buffer与字符串类似,除了可以用.length属性得到字节长度外,还可以用[index]方式读取指定位置的字节,例如:



buffer[0] ; // 0x68;
  Buffer与字符串能够互相转化,例如可以使用指定编码将二进制数据转化为字符串:



var str = buffer.toString("utf-8");  // hello
  将字符串转换为指定编码下的二进制数据:



var buffer= new Buffer("hello", "utf-8") ; // <Buffer 68 65 6c 6c 6f>
  一点儿区别:
  Buffer与字符串有一个重要区别。字符串是只读的,并且对字符串的任何修改得到的都是一个新字符串,原字符串保持不变。
  至于Buffer,更像是可以做指针操作的C语言数组。例如,可以用[index]方式直接修改某个位置的字节。
  -------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
  slice方法也不是返回一个新的Buffer,而更像是返回了指向原Buffer中间的某个位置的指针,如下所示。


[ 0x68, 0x65, 0x6c, 0x6c, 0x6f ]
^           ^
|           |
bin     bin.slice(2)

  因此对slice方法返回的Buffer的修改会作用于原Buffer,例如:



1 var buffer= new Buffer([ 0x68, 0x65, 0x6c, 0x6c, 0x6f ]) ;
2 var sub = bin.slice(2) ;
3 sub[0] = 0x65 ;
4 console.log(buffer) ; //  <Buffer 68 65 65 6c 6f>
  如果想要拷贝一份Buffer,得首先创建一个新的Buffer,并通过.copy方法把原Buffer中的数据复制过去。
  这个类似于申请一块新的内存,并把已有内存中的数据复制过去。以下是一个例子。



1 var buffer= new Buffer([ 0x68, 0x65, 0x6c, 0x6c, 0x6f ]) ;
2 var dup = new Buffer(bin.length) ;
3 buffer.copy(dup) ;
4 dup[0] = 0x48 ;
5 console.log(buffer) ;  // <Buffer 68 65 6c 6c 6f>
6 console.log(dup) ;  // <Buffer 48 65 65 6c 6f>
  总之,Buffer将JS的数据处理能力从字符串扩展到了任意二进制数据。
  以上简单让大家了解一下什么是Buffer,下面具体说说如何使用和具体使用场景。
  二,聊聊Buffer
  JavaScript对字符串处理十分友好,无论是宽字节还是单字节字符串,都被认为是一个字符串。Node中需要处理网络协议、操作数据库、处理图片、文件上传等,还需要处理大量二进制数据,自带的字符串远不能满足这些要求,因此Buffer应运而生。

Buffer结构
  Buffer是一个典型的Javascript和C++结合的模块,性能相关部分用C++实现,非性能相关部分用javascript实现。
  Node在进程启动时Buffer就已经加装进入内存,并将其放入全局对象,因此无需require
  Buffer对象:类似于数组,其元素是16进制的两位数。
  Buffer内存分配
  Buffer对象的内存分配不是在V8的堆内存中,在Node的C++层面实现内存的申请。
  为了高效的使用申请来得内存,Node中采用slab分配机制,slab是一种动态内存管理机制,应用各种*nix操作系统。slab有三种状态:
  (1) full:完全分配状态
  (2) partial:部分分配状态
  (3) empty:没有被分配状态

Buffer的转换
  Buffer对象可以和字符串相互转换,支持的编码类型如下:
  ASCII、UTF-8、UTF-16LE/UCS-2、Base64、Binary、Hex
  字符串转Buffer
  new Buffer(str, [encoding]),默认UTF-8
  buf.write(string, [offset], [length], [encoding])
  Buffer转字符串
  buf.toString([encoding], [start], [end])
  Buffer不支持的编码类型
  通过Buffer.isEncoding(encoding)判断是否支持
  iconv-lite:纯JavaScript实现,更轻量,性能更好无需C++到javascript的转换
  iconv:调用C++的libiconv库完成

Buffer的拼接
  注意 "res.on('data', function(chunk) {})",其中的参数chunk是Buffer对象,直接用+拼接会自动转换为字符串,对于宽字节字符可能会导致乱码产生,
  解决方法:
  (1) 通过可读流中的setEncoding()方法,该方法可以让data事件传递不再是Buffer对象,而是编码后的字符串,其内部使用了StringEncoder模块。
  (2) 将Buffer对象暂存到数组中,最后在组装成一个大Buffer让后编码转换为字符串输出。
  Buffer在文件I/O和网络I/O中广泛应用,其性能举足轻重,比普通字符串性能要高出很多。
  Buffer的使用除了与字符串的转换有性能损耗外,在文件读取时候,有一个highWaterMark设置对性能影响至关重要。
  a,highWaterMark设置对Buffer内存的分配和使用有一定影响。
  b, highWaterMark设置过小,可能导致系统调用次数过多。
  什么时候该用buffer,什么时候不该用  ------ 纯粹的javascript支持unicode码而对二进制不是很支持,当解决TCP流或者文件流的时候,处理流是有必要的,我们保存非utf-8字符串,2进制等等其他格式的时候,我们就必须得使用 ”Buffer“
  三,实例引入



1 var buf = new Buffer("this is text concat test !") ,str = "this is text concat test !" ;
2 console.time("buffer concat test !");
3 var list = [] ;
4 var len = 100000 * buf.length ;
5 for(var i=0;i<100000;i++){
6     list.push(buf) ;
7     len += buf.length ;
8 }
9 var s1 = Buffer.concat(list, len).toString() ;
10 console.timeEnd("buffer concat test !") ;
11 console.time("string concat test !") ;
12 var list = [] ;
13 for (var i = 100000; i >= 0; i--) {
14   list.push(str) ;
15 }
16 var s2 = list.join("") ;
17 console.timeEnd("string concat test !") ;
  以下是运行结果:
DSC0000.jpg

  读取速度肯定string更快,buffer还需要toString()的操作。 所以我们在保存字符串的时候,该用string还是要用string,就算大字符串拼接string的速度也不会比buffer慢。
  那什么时候我们又需要用buffer呢?没办法的时候,当我们保存非utf-8字符串,2进制等等其他格式的时候,我们就必须得使用了。
  四,总结一下
  (1),JavaScript适合处理Unicode编码数据,但对二进制数据的处理并不友好。
  (2),所以处理TCP流或文件系统时,对八位字节流的处理很有必要。
  (3),Node有几个用于处理,创建和消耗八位字节流的方法。
  (4),原始数据存放在一个Buffer实例中,一个Buffer类似一个整数数组,但是它的内存,分配在V8堆栈外。一个Buffer的大小是不能更改的。
(5),处理的编码类型有:ascii,utf8,utf16le,ucs2(utf16le的别名),base64,binary,hex。
(6),Buffer为全局元素,直接new Buffer()就得到一个Buffer实例。

  
                              哈哈哈,本篇结束,未完待续,希望和大家多多交流够沟通,共同进步。。。。。。呼呼呼……(*^__^*)            

运维网声明 1、欢迎大家加入本站运维交流群:群②:261659950 群⑤:202807635 群⑦870801961 群⑧679858003
2、本站所有主题由该帖子作者发表,该帖子作者与运维网享有帖子相关版权
3、所有作品的著作权均归原作者享有,请您和我们一样尊重他人的著作权等合法权益。如果您对作品感到满意,请购买正版
4、禁止制作、复制、发布和传播具有反动、淫秽、色情、暴力、凶杀等内容的信息,一经发现立即删除。若您因此触犯法律,一切后果自负,我们对此不承担任何责任
5、所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其内容的准确性、可靠性、正当性、安全性、合法性等负责,亦不承担任何法律责任
6、所有作品仅供您个人学习、研究或欣赏,不得用于商业或者其他用途,否则,一切后果均由您自己承担,我们对此不承担任何法律责任
7、如涉及侵犯版权等问题,请您及时通知我们,我们将立即采取措施予以解决
8、联系人Email:admin@iyunv.com 网址:www.yunweiku.com

所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其承担任何法律责任,如涉及侵犯版权等问题,请您及时通知我们,我们将立即处理,联系人Email:kefu@iyunv.com,QQ:1061981298 本贴地址:https://www.yunweiku.com/thread-345678-1-1.html 上篇帖子: 大熊君大话NodeJS之------Global Objects全局对象 下篇帖子: nodejs: 真正的一份代码,到处运行
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

扫码加入运维网微信交流群X

扫码加入运维网微信交流群

扫描二维码加入运维网微信交流群,最新一手资源尽在官方微信交流群!快快加入我们吧...

扫描微信二维码查看详情

客服E-mail:kefu@iyunv.com 客服QQ:1061981298


QQ群⑦:运维网交流群⑦ QQ群⑧:运维网交流群⑧ k8s群:运维网kubernetes交流群


提醒:禁止发布任何违反国家法律、法规的言论与图片等内容;本站内容均来自个人观点与网络等信息,非本站认同之观点.


本站大部分资源是网友从网上搜集分享而来,其版权均归原作者及其网站所有,我们尊重他人的合法权益,如有内容侵犯您的合法权益,请及时与我们联系进行核实删除!



合作伙伴: 青云cloud

快速回复 返回顶部 返回列表