a616652325 发表于 2015-4-25 02:20:28

对Python中的整数对象的理解

                  Object对象
  (1)
  PyObject是python中所有对象的基石。
   typedef struct _object
      {
           int ob_refcnt ;//引用计数
           struct _typeobject *ob_type ; //指向对象的类型对象
      }PyObject ;
  我们用PyObject可以表示整数对象这类定长对象,但是像字符串这类非定长对象,就不能用PyOject结构体。于是我们引入了表示这类对象的结构体—PyVarObject
      typetdef struct
     {
         int ob_refcnt ;
         struct _typeobject * ob_type ;
         int ob_size ;
     }PyVarObject ;
  ob_size 表示变长对象中容纳的元素个数。
  

  
  由上我们看到PyVarObject只是对PyObject的扩展,在Python内部所有对象都有相同的头部,即PyObject。故在Python内部我们只需要用一个PyObject *指针就可以引用任何一个对象。而不论该对象是定长对象还是变成对象。
  
  (2)
  Python中任何对象都对应着一个类型对象。类型对象也是对象也对应着一个类型对象。
  整数对象的类型对象是PyIntObject。在Python完成运行环境的初始化后,符号“int”就对应着一个表示的对象,这个对象实际上就是Python内部的PyInt_Type 。
  Python中用户自定义对象和类型对象的类型对象是PyType_Type。
  下面看一下运行时整数对象及其类型对象的关系:
  

  
Python中的引用计数
  
  # define _Py_NewReference(op)   ((op)->ob_refcnt = 1) //引用计数初始化
  # define _Py_Dealloc(op) ((*(op)->ob_type->ob_dealloc)((PyObject *)(op)))
     //类似如C++中的析构函数
  
  # define Py_INCREF(op) ((op)->refcnt ++ ) //引用计数+1
  # define Py_DECREF(op) \
         If( --(op)->refcnt) != 0 ) \
         ;
         Else
        _Py_Dealloc((PyObject *)(op))
  
  # define Py_XINCREF(op) if( (op)==NULL);else Py_INCREF(op)
  # define Py_XDECREF(op) if( (op)==NULL);else Py_DECREF(op)
  
  
                        整数对象
  
  看一段python中加法操作源码:
  static PyObject * int_add(PyIntObject * v , PyIntObject * w)
  {
  Register long a,b,x ;
  CONVERT_TO_LONG(v,a) ; // a=v->ob_ival
  CONVERT_TO_LONG(w,b) ; // b=w->ob_ival
  x = a+b ;
  if( a^x>=0 || b^x>=0 ) //检查结果是否溢出
  return PyInt_FromLong(x);
  return PyLong_Type.tp_as_number->nb_add((PyObject*)v,(PyObject*)w) ;
  //如果结果溢出,那么结果就不是一个PyIntObject,而是一个PyLongObject对象。
  }
  
  # define PyInt_AS_LONG(op)   (((PyIntObject*)(op))->ob_ival)
  # define CONVERT_TO_LONG(obj,lng)   \
  if( PyInt_Check(obj)){
  //判断该对象是否是整数对象,及obj->ob_ival是否等于PyInt_Type
  lng = PyInt_AS_LONG(obj) ;
  }
  Else{
  Py_INCREF(Py_NotImplemented);
  Return Py_NotImplemented ; \
  }
  
(1)    小整数
  
  在实际的编程中我们会经常用到一些小整数,这样就会频繁的开辟和释放内存,造成运行效率的降低,而且会在系统堆上造成大量的碎片,严重影响Python的整体性能。
  为解决这个问题,Python引入了小整数对象池,让这些整数对应的PyIntObject对象常驻内存,并且将其指针放到small_ints中。
  
  看下源码:
  # ifndef NSMALLPOSITIONS
  # define NSMALLPOSITIONS 257
  # endif //
  # ifndef NSMALLNEGINTS
  # define NSMALLNEGINTS 5
  # endif //
  
  # if NSMALLPOSITIONS+NSMALLPOSITIONS>0
  Static PyIntObject *small_ints;
  # endif
  
  在Python 2.5中,将小整数定义为[-5,257)
  
(2) 大整数
  
  对于小整数,Python用小整数对象池完全其对应的Object对象。对于大整数,
  Python提供了一块内存区供这些大整数轮流使用,也就是谁需要时谁使用。
  
  Python用两个指针来维护整数对象池:
  PyIntBlock * block_list = NULL ; //指向为整数对象分配的缓冲区
  PyIntObject * free_list = NULL ; //指向空闲缓冲区
  
  看下源码:
  # define BLOCK_SIZE 1000
  # define BHEAD_SIZE 8
  # define N_INTOBJECTS((BLOCK_SIZE-BHEAD_SIZE)/sizeof(PyIntObject))//=32
  // sizeof(PyIntObject)) = 8
  Struct _intBlock
  {
  Struct _intBlock * next;
  PyIntObject object ;
  }
  Typedef struct _intblockPyIntBlock ;
  Static PyIntBlock * block_list = NULL ;
  Static PyIntObject * free_list = NULL ;
  
  下面来看下Python中如何创建一个整数对象:
  
  PyObject * PyInt_FromLong(long ival)
  {
  Register PyIntObject * v ;
  # If NSMALLPOSITIONS + NSMALLPOSITIONS>0//小整数对象池被激活
  If( ival>=-NSMALLPOSITIONS && ival< NSMALLPOSINTS ) //是小整数
  {
  v = small_ints ;
  Py_INCREF(v) ; //引用计数++,在小整数对象创建时,引用计数初始化为0
  Return (PyObject *)v ;
  }
  # endif //
  //如果是创建大整数对象
  if( free_list = NULL )
  {
  if( (free_list = fill_free_list())==NULL )
  return NULL ;
  /* fill_free_list()函数会在三种情况下使用:
  1,在python运行环境初始化过程中,调用_PyInt_init(void),在这个函数中调用fill_free_list()函数为小整数对象申请内存空间。
  2,Python程序运行时,第一次创建大整数对象,可能会用到此函数。
  3,当free_list = NULL时。*/
  V = free_list ;
  free_list = (PyInt_Object*)free_list->ob_type ;
  PyObject_INIT(v,&PyInt_Type) ;
  //这是一个宏,主要完成两个任务
  (1)      v->ob_type = &PyInt_Type ;
  (2)      _Py_NewReference(v) ; //引用计数初始化为0
  v->ival = ival ;
  return (PyObject*)v ;
  }
  下面来看下fill_free_list()函数,这是一个很重要的函数
  Static PyIntObject * fill_free_list(void)
  {
  PyIntObject *p,*q ;
  P = (PyIntObject*)PyMem_MALLOC(sizeof(PyIntBlock)) ;
  If( p == NULL )
  Return (PyIntObject*)PyErr_NoMemony();
  //采用头插法,将新申请的内存块插入由block_list维护的内存块链表中
  ((PyIntBlock *)p)->next = block_list ;
  Block_list = (PyIntBlock *)p ;
  
  //将PyIntBlock中的objects数组转换为单向链表
  q = p+ N_INTOBJECTS ;
  while( --q > p )
  q->ob_type = (struct _typeobject *)(q-1) ;
  p->ob_type = NULL ;
  return p+ N_INTOBJECTS-1 ;
  }
  
  
  使用头插法插入一个PyIntBlock块见下图:

  将PyIntBlock中的数组转换为单向链表见下图:

  
   删除对象
  当删除一个大整数对象时,该对象幷不是直接被系统回收,而是插入到free_list所维护的空闲链表中。见下图示:

  
  看下源码:
  Static void int_dealloc( PyIntObject *v)
  {
  If( PyInt_CheckExact(v)) //检查是不是整数对象
  {
  // 将该系统占用的内存空间插入到free_list所维护的空闲链表中
  v->ob_type = (struct _typeobject *)free_list ;
  free_list = v ;
  }
  Else
  v->ob_type->tp_free( (PyObject*)v ) ;
  }
  有一个问题:del一个大整数对象后,该大整数对象所占用的内存空间会被对象池回收,但是如果删除一个小整数对象呢?
  
  
  现在我们就剩下最后一个问题了,我们看到在small_ints中,它维护的只是PyIntObject的指针,那么这些小整数对象是在什么对方被创建和初始化的呢。完成它的是_PyInt_Init。在Python初始化的时候,_PyInt_Init被调用,内存被申请,小整数对象被调用。
  
  我们看下源码:
  
  int _PyInt_Init(void)
  {
  PyIntObject *v ;
  Int ival ;
  # if NSMALLNEGINTS + NSMALLPOSINTS > 0
  for( ival = - NSMALLNEGINTS;ival< NSMALLPOSINTS; i++ )
  {
  if(!free_list && (free_list = fill_free_list())==NULL)
  return 0;
  v = free_list ;
  free_list = (PyIntObject*)v->ob_type ;
  PyObject_INIT(v,&PyInt_Type);
  v->ob_ival = ival ;
  small_int = v ;
  }
  # endif
  Return 1 ;
  }
  从小整数的创建过程中可以看出,这些永生不灭的小整数对象也是生存在有block_list所维护的内存上的。
  
  
  
  
  
  
  

  
页: [1]
查看完整版本: 对Python中的整数对象的理解