设为首页 收藏本站
查看: 1187|回复: 0

[经验分享] [Python源码学习]之bytecode

[复制链接]

尚未签到

发表于 2017-4-24 13:05:43 | 显示全部楼层 |阅读模式


源码

xxx.py文件

或 字符串



==>



字节码

可缓存在xxx.pyc



==>



结果




pythonX.dll

libpythonX.X.a



pythonX.dll

libpythonX.X.a




Py_CompileString***(...)



PyEval_Eval***(...)




compile



eval





  • Python 代码首先被编译成 bytecode,然后才被解释器进行执行。
  • bytecode 可被缓存动.pyc或.pyo文件内。


  • bytecode 对应源码中的 PyCodeObject 结构体对象



生成 .pyc 文件



代码中通过import使用到的.py文件会自动编译成.pyc文件,如何手动来编译呢?


  • 交互模式或者代码中



>>> import py_compile
>>> py_compile.compile('hello.py')
>>>


  • 或者使用 命令行



python3 -m py_compile hello.py

生成的文件(个人机子上的结果):

__pycache__/hello.cpython-32.pyc




  • 将当前目录下的文件都编译成 .pyc 使用compileall模块



python -m compileall .

这儿的py_compile和compileall使用的都是builtins模块的compile()函数


builtins



在python执行环境中,builtins模块中:



compile()



编译成字节码,code对象(PyCodeObject)




eval()、exec()



执行





一个例子:

>>> a = "1+2"
>>> b = compile(a, "test.py", 'single')
>>> type(b)
<class 'code'>
>>> eval(b)
3

它们对应C高层接口中的下面两类函数:



Py_CompileString***(...)



将python代码编译成bytecode




PyEval_Eval***(...)



执行这个bytecode






代码



compile() 和 eval()、exec() 是内建模块中的函数,所以瞅瞅


  • Python/bltinmodule.c

中定义的方法:

static PyMethodDef builtin_methods[] = {
//...
  {"compile", (PyCFunction)builtin_compile, METH_VARARGS|METH_KEYWORDS, compile_doc},
//...
  {"eval",  builtin_eval,       METH_VARARGS, eval_doc},
  {"exec",  builtin_exec,       METH_VARARGS, exec_doc},
//...
  {NULL,    NULL},
};

其中:




  • builtin_compile() 调用PyAST_CompileEx或Py_CompileStringExFlags



static PyObject *
builtin_compile(PyObject *self, PyObject *args, PyObject *kwds)
{
....
    is_ast = PyAST_Check(cmd);
    if (is_ast) {
...
            result = (PyObject*)PyAST_CompileEx(mod, filename,
...
        goto finally;
    }
...
    result = Py_CompileStringExFlags(str, filename, start[mode], &cf, optimize);
    goto finally;

finally:
    Py_DECREF(filename_obj);
    return result;
}




  • eval() 调用PyEval_EvalCode(对于bytecode)或PyRun_StringFlags(对字符串)



static PyObject *
builtin_eval(PyObject *self, PyObject *args)
{
...
    if (PyCode_Check(cmd)) {
        return PyEval_EvalCode(cmd, globals, locals);
    }

    cf.cf_flags = PyCF_SOURCE_IS_UTF8;
    str = source_as_string(cmd, "eval", "string, bytes or code", &cf);
...
    (void)PyEval_MergeCompilerFlags(&cf);
    result = PyRun_StringFlags(str, Py_eval_input, globals, locals, &cf);
    Py_XDECREF(tmp);
    return result;
}

恩,这样一来,总算将C代码和python代码联系上了。


PyCodeObject



前面提到的 bytecode,具体到源码中,就是PyCodeObject对象了(对应python环境中的code):


定义



先看一下该结构体的定义:


/* Bytecode object */
typedef struct {
    PyObject_HEAD
    int co_argcount;            /* #arguments, except *args */
    int co_kwonlyargcount;      /* #keyword only arguments */
    int co_nlocals;             /* #local variables */
    int co_stacksize;           /* #entries needed for evaluation stack */
    int co_flags;               /* CO_..., see below */
    PyObject *co_code;          /* instruction opcodes */
    PyObject *co_consts;        /* list (constants used) */
    PyObject *co_names;         /* list of strings (names used) */
    PyObject *co_varnames;      /* tuple of strings (local variable names) */
    PyObject *co_freevars;      /* tuple of strings (free variable names) */
    PyObject *co_cellvars;      /* tuple of strings (cell variable names) */
    /* The rest doesn't count for hash or comparisons */
    PyObject *co_filename;      /* unicode (where it was loaded from) */
    PyObject *co_name;          /* unicode (name, for reference) */
    int co_firstlineno;         /* first source line number */
    PyObject *co_lnotab;        /* string (encoding addr<->lineno mapping) See
                                   Objects/lnotab_notes.txt for details. */
    void *co_zombieframe;     /* for optimization only (see frameobject.c) */
    PyObject *co_weakreflist;   /* to support weakrefs to code objects */
} PyCodeObject;


  • 各个成员什么含义?源码中有解释了,下面我们直接看看:如何在python中查看这些成员


查看code的成员



Python提供了简单的封装,于是,我们可以直接查看这些成员。例子:


>>> c = compile("1+2", "test.py", "single")
>>> c.co_argcount
0
>>> c.co_code
b'd\x03\x00Fd\x02\x00S'
>>> c.co_consts
(1, 2, None, 3)
>>> c.co_name
'<module>'
>>> c.co_filename
'test.py'

其中 co_code 就是字节码了:d\x03\x00Fd\x02\x00S
那么如何理解这些代码??


字节码



co_code 写成10进制:10030701002083



100



指令码: LOAD_CONST




3



co_consts中的第3个常数




0





70



指令码: PRINT_EXPR




100



指令码: LOAD_CONST




2



co_consts中的第2个常数




0





83



指令码: RETURN_VALUE





指令码定义在文件 Include/opcode.h 中。
不过这样阅读指令码真的很难受,幸好,python提供了 dis 模块


dis



用它来看看前面的例子

>>> c = compile("1+2", "test.py", "single")
>>> import dis
>>> dis.dis(c)
  1           0 LOAD_CONST               3 (3)
              3 PRINT_EXPR           
              4 LOAD_CONST               2 (None)
              7 RETURN_VALUE

恩,一目了然。最开始的那个1是行号,指令码前面的数字是它在co_code中的索引。
恩,dis 是很有用的东西,不过偶还没学会怎么利用它。


参考






  • http://docs.python.org/py3k/glossary.html#term-bytecode



  • http://docs.python.org/py3k/library/functions.html#compile



  • http://docs.python.org/py3k/library/dis.html#bytecodes



  • http://docs.python.org/py3k/library/code.html#module-code



  • http://docs.python.org/py3k/library/stdtypes.html#code-objects



  • http://www.python-course.eu/execute_script.php


运维网声明 1、欢迎大家加入本站运维交流群:群②:261659950 群⑤:202807635 群⑦870801961 群⑧679858003
2、本站所有主题由该帖子作者发表,该帖子作者与运维网享有帖子相关版权
3、所有作品的著作权均归原作者享有,请您和我们一样尊重他人的著作权等合法权益。如果您对作品感到满意,请购买正版
4、禁止制作、复制、发布和传播具有反动、淫秽、色情、暴力、凶杀等内容的信息,一经发现立即删除。若您因此触犯法律,一切后果自负,我们对此不承担任何责任
5、所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其内容的准确性、可靠性、正当性、安全性、合法性等负责,亦不承担任何法律责任
6、所有作品仅供您个人学习、研究或欣赏,不得用于商业或者其他用途,否则,一切后果均由您自己承担,我们对此不承担任何法律责任
7、如涉及侵犯版权等问题,请您及时通知我们,我们将立即采取措施予以解决
8、联系人Email:admin@iyunv.com 网址:www.yunweiku.com

所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其承担任何法律责任,如涉及侵犯版权等问题,请您及时通知我们,我们将立即处理,联系人Email:kefu@iyunv.com,QQ:1061981298 本贴地址:https://www.yunweiku.com/thread-368707-1-1.html 上篇帖子: Python多线程实例 下篇帖子: python 类的定义
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

扫码加入运维网微信交流群X

扫码加入运维网微信交流群

扫描二维码加入运维网微信交流群,最新一手资源尽在官方微信交流群!快快加入我们吧...

扫描微信二维码查看详情

客服E-mail:kefu@iyunv.com 客服QQ:1061981298


QQ群⑦:运维网交流群⑦ QQ群⑧:运维网交流群⑧ k8s群:运维网kubernetes交流群


提醒:禁止发布任何违反国家法律、法规的言论与图片等内容;本站内容均来自个人观点与网络等信息,非本站认同之观点.


本站大部分资源是网友从网上搜集分享而来,其版权均归原作者及其网站所有,我们尊重他人的合法权益,如有内容侵犯您的合法权益,请及时与我们联系进行核实删除!



合作伙伴: 青云cloud

快速回复 返回顶部 返回列表