对Python中的整数对象的理解

a616652325 发表于 2015-4-25 02:20:28

               Object对象
　　(1)
　　PyObject是python中所有对象的基石。
　　 typedef struct _object
　　 {
　　       int ob_refcnt ;//引用计数
　　       struct _typeobject *ob_type ; //指向对象的类型对象
　　 }PyObject ;
　　我们用PyObject可以表示整数对象这类定长对象，但是像字符串这类非定长对象，就不能用PyOject结构体。于是我们引入了表示这类对象的结构体—PyVarObject
　　 typetdef struct
　　 {
　　    int ob_refcnt ;
　　    struct _typeobject * ob_type ;
　　    int ob_size ;
　　 }PyVarObject ;
　　ob_size 表示变长对象中容纳的元素个数。
　　

　　
　　由上我们看到PyVarObject只是对PyObject的扩展，在Python内部所有对象都有相同的头部，即PyObject。故在Python内部我们只需要用一个PyObject *指针就可以引用任何一个对象。而不论该对象是定长对象还是变成对象。
　　
　　(2)
　　Python中任何对象都对应着一个类型对象。类型对象也是对象也对应着一个类型对象。
　　整数对象的类型对象是PyIntObject。在Python完成运行环境的初始化后，符号“int”就对应着一个表示的对象，这个对象实际上就是Python内部的PyInt_Type 。
　　Python中用户自定义对象和类型对象的类型对象是PyType_Type。
　　下面看一下运行时整数对象及其类型对象的关系：
　　

　　
Python中的引用计数
　　
　　# define _Py_NewReference(op) ((op)->ob_refcnt = 1) //引用计数初始化
　　# define _Py_Dealloc(op) ((*(op)->ob_type->ob_dealloc)((PyObject *)(op)))
　　 //类似如C++中的析构函数
　　
　　# define Py_INCREF(op) ((op)->refcnt ++ ) //引用计数+1
　　# define Py_DECREF(op) \
　　    If( --(op)->refcnt) != 0 ) \
　　    ;
　　    Else
　　    _Py_Dealloc((PyObject *)(op))
　　
　　# define Py_XINCREF(op) if( (op)==NULL);else Py_INCREF(op)
　　# define Py_XDECREF(op) if( (op)==NULL);else Py_DECREF(op)
　　
　　
                     整数对象
　　
　　看一段python中加法操作源码：
　　static PyObject * int_add(PyIntObject * v , PyIntObject * w)
　　{
　　Register long a,b,x ;
　　CONVERT_TO_LONG(v,a) ; // a=v->ob_ival
　　CONVERT_TO_LONG(w,b) ; // b=w->ob_ival
　　x = a+b ;
　　if( a^x>=0 || b^x>=0 ) //检查结果是否溢出
　　return PyInt_FromLong(x);
　　return PyLong_Type.tp_as_number->nb_add((PyObject*)v,(PyObject*)w) ;
　　//如果结果溢出，那么结果就不是一个PyIntObject，而是一个PyLongObject对象。
　　}
　　
　　# define PyInt_AS_LONG(op) (((PyIntObject*)(op))->ob_ival)
　　# define CONVERT_TO_LONG(obj,lng) \
　　if( PyInt_Check(obj)){
　　//判断该对象是否是整数对象，及obj->ob_ival是否等于PyInt_Type
　　lng = PyInt_AS_LONG(obj) ;
　　}
　　Else{
　　Py_INCREF(Py_NotImplemented);
　　Return Py_NotImplemented ; \
　　}
　　
（1）小整数
　　
　　在实际的编程中我们会经常用到一些小整数，这样就会频繁的开辟和释放内存，造成运行效率的降低，而且会在系统堆上造成大量的碎片，严重影响Python的整体性能。
　　为解决这个问题，Python引入了小整数对象池，让这些整数对应的PyIntObject对象常驻内存，并且将其指针放到small_ints中。
　　
　　看下源码：
　　# ifndef NSMALLPOSITIONS
　　# define NSMALLPOSITIONS 257
　　# endif //
　　# ifndef NSMALLNEGINTS
　　# define NSMALLNEGINTS 5
　　# endif //
　　
　　# if NSMALLPOSITIONS+NSMALLPOSITIONS>0
　　Static PyIntObject *small_ints;
　　# endif
　　
　　在Python 2.5中，将小整数定义为[-5,257)
　　
(2) 大整数
　　
　　对于小整数，Python用小整数对象池完全其对应的Object对象。对于大整数，
　　Python提供了一块内存区供这些大整数轮流使用，也就是谁需要时谁使用。
　　
　　Python用两个指针来维护整数对象池：
　　PyIntBlock * block_list = NULL ; //指向为整数对象分配的缓冲区
　　PyIntObject * free_list = NULL ; //指向空闲缓冲区
　　
　　看下源码：
　　# define BLOCK_SIZE 1000
　　# define BHEAD_SIZE 8
　　# define N_INTOBJECTS((BLOCK_SIZE-BHEAD_SIZE)/sizeof(PyIntObject))//=32
　　// sizeof(PyIntObject)) = 8
　　Struct _intBlock
　　{
　　Struct _intBlock * next;
　　PyIntObject object ;
　　}
　　Typedef struct _intblockPyIntBlock ;
　　Static PyIntBlock * block_list = NULL ;
　　Static PyIntObject * free_list = NULL ;
　　
　　下面来看下Python中如何创建一个整数对象：
　　
　　PyObject * PyInt_FromLong(long ival)
　　{
　　Register PyIntObject * v ;
　　# If NSMALLPOSITIONS + NSMALLPOSITIONS>0//小整数对象池被激活
　　If( ival>=-NSMALLPOSITIONS && ival< NSMALLPOSINTS ) //是小整数
　　{
　　v = small_ints ;
　　Py_INCREF(v) ; //引用计数++，在小整数对象创建时,引用计数初始化为0
　　Return (PyObject *)v ;
　　}
　　# endif //
　　//如果是创建大整数对象
　　if( free_list = NULL )
　　{
　　if( (free_list = fill_free_list())==NULL )
　　return NULL ;
　　/* fill_free_list()函数会在三种情况下使用：
　　1，在python运行环境初始化过程中，调用_PyInt_init(void),在这个函数中调用fill_free_list()函数为小整数对象申请内存空间。
　　2，Python程序运行时，第一次创建大整数对象，可能会用到此函数。
　　3，当free_list = NULL时。*/
　　V = free_list ;
　　free_list = (PyInt_Object*)free_list->ob_type ;
　　PyObject_INIT(v,&PyInt_Type) ;
　　//这是一个宏，主要完成两个任务
　　（1）    v->ob_type = &PyInt_Type ;
　　（2）    _Py_NewReference(v) ; //引用计数初始化为0
　　v->ival = ival ;
　　return (PyObject*)v ;
　　}
　　下面来看下fill_free_list()函数，这是一个很重要的函数
　　Static PyIntObject * fill_free_list(void)
　　{
　　PyIntObject *p,*q ;
　　P = (PyIntObject*)PyMem_MALLOC(sizeof(PyIntBlock)) ;
　　If( p == NULL )
　　Return (PyIntObject*)PyErr_NoMemony();
　　//采用头插法，将新申请的内存块插入由block_list维护的内存块链表中
　　((PyIntBlock *)p)->next = block_list ;
　　Block_list = (PyIntBlock *)p ;
　　
　　//将PyIntBlock中的objects数组转换为单向链表
　　q = p+ N_INTOBJECTS ;
　　while( --q > p )
　　q->ob_type = (struct _typeobject *)(q-1) ;
　　p->ob_type = NULL ;
　　return p+ N_INTOBJECTS-1 ;
　　}
　　
　　
　　使用头插法插入一个PyIntBlock块见下图：

　　将PyIntBlock中的数组转换为单向链表见下图：

　　
删除对象
　　当删除一个大整数对象时，该对象幷不是直接被系统回收，而是插入到free_list所维护的空闲链表中。见下图示：

　　
　　看下源码：
　　Static void int_dealloc( PyIntObject *v)
　　{
　　If( PyInt_CheckExact(v)) //检查是不是整数对象
　　{
　　// 将该系统占用的内存空间插入到free_list所维护的空闲链表中
　　v->ob_type = (struct _typeobject *)free_list ;
　　free_list = v ;
　　}
　　Else
　　v->ob_type->tp_free( (PyObject*)v ) ;
　　}
　　有一个问题：del一个大整数对象后，该大整数对象所占用的内存空间会被对象池回收，但是如果删除一个小整数对象呢？
　　
　　
　　现在我们就剩下最后一个问题了，我们看到在small_ints中，它维护的只是PyIntObject的指针，那么这些小整数对象是在什么对方被创建和初始化的呢。完成它的是_PyInt_Init。在Python初始化的时候，_PyInt_Init被调用，内存被申请，小整数对象被调用。
　　
　　我们看下源码：
　　
　　int _PyInt_Init(void)
　　{
　　PyIntObject *v ;
　　Int ival ;
　　# if NSMALLNEGINTS + NSMALLPOSINTS > 0
　　for( ival = - NSMALLNEGINTS;ival< NSMALLPOSINTS; i++ )
　　{
　　if（！free_list && (free_list = fill_free_list（）)==NULL）
　　return 0;
　　v = free_list ;
　　free_list = (PyIntObject*)v->ob_type ;
　　PyObject_INIT(v,&PyInt_Type);
　　v->ob_ival = ival ;
　　small_int = v ;
　　}
　　# endif
　　Return 1 ;
　　}
　　从小整数的创建过程中可以看出，这些永生不灭的小整数对象也是生存在有block_list所维护的内存上的。
　　
　　
　　
　　
　　
　　
　　

　　

页: [1]

运维网's Archiver

对Python中的整数对象的理解