ahxcjxzxh 发表于 2017-3-22 09:38:35

关于PHP的strtoupper函数

  今天看到了PHP实现的标准扩展函数这一段,第一个挑了string相关的函数来看,毕竟这个是用的最多的。
  看到了strtoupper函数的实现。如下:

char *php_strtoupper(char *s, size_t len)
{
unsigned char *c, *e;
c = (unsigned char *)s;
e = (unsigned char *)c+len;
while (c < e) {
*c = toupper(*c);
c++;
}   
return s;
}

  第一感觉就是返回值和传入值是一个东西,而且经过该函数的处理,实参也会被修改,也就是说传入的字符串也会被upper。
  但这个和平时使用的感觉不对,立马来试下:

<?php
$s = "helloworld";
echo strtoupper($s);
echo $s;
?>
  运行结果是:
  HELLOWORLD
  helloworld
  和直觉上是一样的,但和上面的C代码中的逻辑不符啊。咋回事呢?
  ********************************************************
  问题出在这里:
  其实上述C代码中的参数并不是直接来自于strtoupper($s)中的$s.
  PHP内部获取$s之后的处理过程为:

PHP_FUNCTION(strtoupper)
{
char *arg;
int arglen;
if (zend_parse_parameters(ZEND_NUM_ARGS() TSRMLS_CC, "s", &arg, &arglen) == FAILURE) {
return;
}
arg = estrndup(arg, arglen);
php_strtoupper(arg, arglen);
RETURN_STRINGL(arg, arglen, 0);
}

  不难发现,即使通过zend_parse_parameters获取的arg是指向$s字符串的。后面在调用php_strtoupper函数之前还需要:

arg=estrndup(arg,arglen);
  那这个函数是干什么的呢?
  顺疼莫瓜,找到了这个东西:

#define estrndup(s, length)               _estrndup((s), (length) ZEND_FILE_LINE_CC ZEND_FILE_LINE_EMPTY_CC)

  和这个东西:

ZEND_API char *_estrndup(const char *s, uint length ZEND_FILE_LINE_DC ZEND_FILE_LINE_ORIG_DC)
{
char *p;
p = (char *) _emalloc(length+1 ZEND_FILE_LINE_RELAY_CC ZEND_FILE_LINE_ORIG_RELAY_CC);
if (UNEXPECTED(p == NULL)) {
return p;
}   
memcpy(p, s, length);
p = 0;
return p;
}

  注意哲理的_emalloc函数,这个重新分配了一段内存空间。然后memcpy(p,s,lenth)。
  经过这个过程PHP中的$s已经在内部被“偷梁换柱”成这个“p”了。
  到这里就不难理解,php_strtoupper函数中的参数其实不是$s,而是这个*p。这个p指向的字符串的每个字符都会被upper。然后在php_strtoupper中直接返回这个p也就正常了。
  结合上面的例子,$s始终都是"helloworld",PHP内部创建的p一开是也是"helloworld",然后会变为"HELLOWORLD"。
  最后strtoupper($s)这个也就是PHP在内部创建的这个p了。也就是"HELLOWORLD"。
  到这里就明白了。^_^
页: [1]
查看完整版本: 关于PHP的strtoupper函数