设为首页 收藏本站
查看: 1287|回复: 0

[经验分享] golang string和[]byte的对比

[复制链接]

尚未签到

发表于 2018-9-19 12:53:30 | 显示全部楼层 |阅读模式
golang string和[]byte的对比
  为啥string和[]byte类型转换需要一定的代价?
  为啥内置函数copy会有一种特殊情况copy(dst []byte, src string) int?
  string和[]byte,底层都是数组,但为什么[]byte比string灵活,拼接性能也更高(动态字符串拼接性能对比)?
  今天看了源码探究了一下。
  以下所有观点都是个人愚见,有不同建议或补充的的欢迎emial我aboutme
何为string?
  什么是字符串?标准库builtin的解释:
type string  

  
string is the set of all strings of 8-bit bytes, conventionally but not necessarily representing UTF-8-encoded text. A string may be empty, but not nil. Values of string type are immutable.
  

  简单的来说字符串是一系列8位字节的集合,通常但不一定代表UTF-8编码的文本。字符串可以为空,但不能为nil。而且字符串的值是不能改变的。
  不同的语言字符串有不同的实现,在go的源码中src/runtime/string.go,string的定义如下:
type stringStruct struct {  str unsafe.Pointer
  len int
  
}
  

  可以看到str其实是个指针,指向某个数组的首地址,另一个字段是len长度。那到这个数组是什么呢? 在实例化这个stringStruct的时候:
func gostringnocopy(str *byte) string {  ss := stringStruct{str: unsafe.Pointer(str), len: findnull(str)}
  s := *(*string)(unsafe.Pointer(&ss))
  return s
  
}
  

  哈哈,其实就是byte数组,而且要注意string其实就是个struct。
何为[]byte?
  首先在go里面,byte是uint8的别名。而slice结构在go的源码中src/runtime/slice.go定义:
type slice struct {  array unsafe.Pointer
  len   int
  cap   int
  
}
  

  array是数组的指针,len表示长度,cap表示容量。除了cap,其他看起来和string的结构很像。
  但其实他们差别真的很大。
区别
字符串的值是不能改变
  在前面说到了字符串的值是不能改变的,这句话其实不完整,应该说字符串的值不能被更改,但可以被替换。 还是以string的结构体来解释吧,所有的string在底层都是这样的一个结构体stringStruct{str: str_point, len: str_len},string结构体的str指针指向的是一个字符常量的地址, 这个地址里面的内容是不可以被改变的,因为它是只读的,但是这个指针可以指向不同的地址,我们来对比一下string、[]byte类型重新赋值的区别:
s := "A1" // 分配存储"A1"的内存空间,s结构体里的str指针指向这快内存  
s = "A2"  // 重新给"A2"的分配内存空间,s结构体里的str指针指向这快内存
  

  其实[]byte和string的差别是更改变量的时候array的内容可以被更改。
s := []byte{1} // 分配存储1数组的内存空间,s结构体的array指针指向这个数组。  
s = []byte{2}  // 将array的内容改为2
  

  因为string的指针指向的内容是不可以更改的,所以每更改一次字符串,就得重新分配一次内存,之前分配空间的还得由gc回收,这是导致string操作低效的根本原因。
string和[]byte的相互转换
  将string转为[]byte,语法[]byte(string)源码如下:
func stringtoslicebyte(buf *tmpBuf, s string) []byte {  var b []byte
  if buf != nil && len(s)   


  *(*slice)(unsafe.Pointer(&b)) = slice{p,>  

  return
  
}
  

  可以看到b是新分配的,然后再将s复制给b,至于为啥copy函数可以直接把string复制给[]byte,那是因为go源码单独实现了一个slicestringcopy函数来实现,具体可以看src/runtime/slice.go。
  将[]byte转为string,语法string([]byte)源码如下:
func slicebytetostring(buf *tmpBuf, b []byte) string {  l := len(b)
  if l == 0 {

  // Turns out to be a>  // Consider that you want to parse out data between parens in "foo()bar",
  // you find the indices and convert the subslice to string.
  return ""
  }
  if raceenabled && l > 0 {
  racereadrangepc(unsafe.Pointer(&b[0]),
  uintptr(l),
  getcallerpc(unsafe.Pointer(&buf)),
  funcPC(slicebytetostring))
  }
  if msanenabled && l > 0 {
  msanread(unsafe.Pointer(&b[0]), uintptr(l))
  }
  s, c := rawstringtmp(buf, l)
  copy(c, b)
  return s
  
}
  

  
func rawstringtmp(buf *tmpBuf, l int) (s string, b []byte) {
  if buf != nil && l

运维网声明 1、欢迎大家加入本站运维交流群:群②:261659950 群⑤:202807635 群⑦870801961 群⑧679858003
2、本站所有主题由该帖子作者发表,该帖子作者与运维网享有帖子相关版权
3、所有作品的著作权均归原作者享有,请您和我们一样尊重他人的著作权等合法权益。如果您对作品感到满意,请购买正版
4、禁止制作、复制、发布和传播具有反动、淫秽、色情、暴力、凶杀等内容的信息,一经发现立即删除。若您因此触犯法律,一切后果自负,我们对此不承担任何责任
5、所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其内容的准确性、可靠性、正当性、安全性、合法性等负责,亦不承担任何法律责任
6、所有作品仅供您个人学习、研究或欣赏,不得用于商业或者其他用途,否则,一切后果均由您自己承担,我们对此不承担任何法律责任
7、如涉及侵犯版权等问题,请您及时通知我们,我们将立即采取措施予以解决
8、联系人Email:admin@iyunv.com 网址:www.yunweiku.com

所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其承担任何法律责任,如涉及侵犯版权等问题,请您及时通知我们,我们将立即处理,联系人Email:kefu@iyunv.com,QQ:1061981298 本贴地址:https://www.yunweiku.com/thread-594279-1-1.html 上篇帖子: https原理以及golang基本实现 下篇帖子: visual code golang配置
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

扫码加入运维网微信交流群X

扫码加入运维网微信交流群

扫描二维码加入运维网微信交流群,最新一手资源尽在官方微信交流群!快快加入我们吧...

扫描微信二维码查看详情

客服E-mail:kefu@iyunv.com 客服QQ:1061981298


QQ群⑦:运维网交流群⑦ QQ群⑧:运维网交流群⑧ k8s群:运维网kubernetes交流群


提醒:禁止发布任何违反国家法律、法规的言论与图片等内容;本站内容均来自个人观点与网络等信息,非本站认同之观点.


本站大部分资源是网友从网上搜集分享而来,其版权均归原作者及其网站所有,我们尊重他人的合法权益,如有内容侵犯您的合法权益,请及时与我们联系进行核实删除!



合作伙伴: 青云cloud

快速回复 返回顶部 返回列表