解释型语言和编译型语言的不同以及Python如何运行

13916729435 发表于 2015-11-29 11:43:59

　　计划写关于Python中如何实现属性管理、函数（或类方法）管理、类管理的几篇成系列的文章。
　　而这篇文章写在这个系列之前，希望对后面几篇文章的理解有所帮助。
　　老实说，我也是在网上搜索了一些资料才写的这篇文章，如果有的地方写的不够好，请指正...

何为编译？

[*]生成目标文件。　　

[*]且目标文件是针对特定的 CPU 体系的(注意，开头用了"且"字)。　　为ARM生成的目标文件，不能被用于MIPS的CPU，也不能用于x86的CPU。反过来说也是成立的。
　　也就是说这段代码在生成目标文件的过错中就已经被翻译成了目标CPU指令，所以如果这个程序需要在另外一种CPU上面运行，这个代码就必须重新翻译。
　　而上述这个翻译过程叫做编译。

何为解释？
　　对于各种非编译型语言（例如python/java）来说，可能不存在某种翻译成中间文件的过错，可能存在某种编译成中间文件的过程
　　如果存在翻译过错，那么他们翻译生成的通常是一种『平台无关』的中间代码，这种代码一般不是针对特定的CPU平台，他们是在运行过程中才被翻译成目标CPU指令的，因而在ARM CPU上能执行，换到MIPS也能执行，换到x86也能执行，不需要重新对源代码进行翻译。
　　而由于这些中间代码并不是能在CPU上直接运行，所以需要某种中介(叫做虚拟机)在执行时负责把代码翻译成CPU能执行的指令。

区别
　　编译型语言生成的文件已经针对某个特定的CPU生成了最终文件，所以在下载的时候针对不同的CPU下载不同的文件，这就是为什么在网上下载某个文件时，Windows系统用户下载Windows的下载包(因为Windows是操作x86系列CPU的)，而Android手机(因为Android是操作ARM系列CPU的)需要下载Android类型的下载包。
　　针对解释型语言，因为你的中间文件并不是针对某个CPU的，所以如果某人在网上共享了一个Python源代码或者中间代码（字节码），那么不管你运行什么操作系统，下载的文件是一样的。而如果你原来没有下载虚拟机的话，可能你需要下载一个虚拟机才能够运行这个下载的文件。
　　你可能会说，我只要装了Python，就可以运行下载下来的Python文件了呀，这是因为你下载的Python运行包中已经包含了一个虚拟机。

简单总结：
　　1，编译型语言在编译过程中生成目标平台的指令，解释型语言在运行过程中才生成目标平台的指令。
　　2，虚拟机的任务是在运行过程中将中间代码翻译成目标平台的指令。

优缺点

[*]解释语言需要考虑不同平台的共性。比如A平台支持加法和乘法，而B平台仅支持加法。为了执行9乘9这个操作同时还要保证它在A和B两个平台上都能运行，必须将9乘9翻译成A.B两平台都支持的加法，即9个9相加。所以势必会影响效率。　　

[*]解释语言具有跨平台的优点，只要在平台上装了针对于该平台的虚拟机，那么一次编写，N次运行，所以生产效率高。　　

[*]当代码发生更改时，解释语言由于时解释一句执行一句，效率不会发生更改。但是编译语言需要重新编译，效率会受到影响。　　

[*]对解释型语言来说，代码的错误检查发生在执行时。
Python的运作模式
　　讲了这么多，下面的部分是才是真正对我们编写代码有实际影响的。
　　python运行时分为下面的四步：

[*]词法分析　　

[*]句法分析　　

[*]编译　　

[*]解释

[*]词法分析的工作就是将输入的原始代码分解为一些符号token（包括标示符，关键字，数字, 操作符等）。这个过程中是不会报任何错的。　　

[*]　　句法分析程序再接收这些符号，并用一种结构来展现它们之间的关系（在这种情况下使用的抽象语法树）。此时如果出现句法错误，会有提示。
　　我们常说，Python运行时不会执行函数，所以也不会报函数中的错误。
　　其实是说的片面的，请看下面的代码，我在函数f中写了一個语法错误，Python会报错。
　　

L=　　
def f():
　　L1=
　　

　　执行结果如下：
　　

File "hh.py", line 4　　L1=
　　^
　　
SyntaxError: invalid syntax

[*]　　在句法分析后Python接收这棵抽象语法树，并将它转化为一个（或多个）代码对象。此时会出现我们说的中间码，或者说字节码。
　　

>>> def f(x=1,y=2):　　
... a='a'
　　
... b='b'
　　
... return x+y
　　
...
　　
>>> f.__code__
　　

　　
>>> dir(f.__code__)
　　
['__class__', '__delattr__', '__dir__', '__doc__', '__eq__', '__format__', '__ge__', '__getattribute__', '__gt__', '__hash__', '__init__', '__le__', '__lt__', '__ne__', '__new__', '__reduce__', '__reduce_ex__', '__repr__', '__setattr__', '__sizeof__', '__str__', '__subclasshook__', 'co_argcount', 'co_cellvars', 'co_code', 'co_consts', 'co_filename', 'co_firstlineno', 'co_flags', 'co_freevars', 'co_kwonlyargcount', 'co_lnotab', 'co_name', 'co_names', 'co_nlocals', 'co_stacksize', 'co_varnames']
　　
>>> f.__code__.co_name
　　
'f'
　　
>>> f.__code__.co_nlocals #定义的局部变量个数
　　
4
　　
>>> f.__code__.co_varnames
　　
('x', 'y', 'a', 'b')
　　
>>> f.__code__.co_argcount
　　
2
　　
>>> f.__code__.co_code #字节码
　　
b'd\x01\x00}\x02\x00d\x02\x00}\x03\x00|\x00\x00|\x01\x00\x17S'
　　

　　如果我们直接运行一个Python文件，那么Python在执行完后就把这个字节码文件删除掉了，因为Python认为复用性不高。
　　但是如果是一个模块文件，那么Python会存起来，我们来做个实验。
　　a.py
　　

import b　　

　　b.py
　　

def f(a=1):　　print(a)
　　

　　当我们运行只有唯一一条语句的a.py时，Python会创立一个__pycache__的文件夹，其中就包括了b.cpython-34.pyc文件，这个就是b.py的字节码文件，如果用open函数打开来看看，就会看到下面的二进制文件，如果用普通方式打开，那么会提示编码错误。
　　

>>> open('__pycache__/b.cpython-34.pyc','rb').read()　　
b'\xee\x0c\r\n0%\xd8U\x19\x00\x00\x00\xe3\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x00\x03\x00\x00\x00@\x00\x00\x00s\x13\x00\x00\x00d\x00\x00d\x01\x00d\x02\x00\x84\x01\x00Z\x00\x00d\x03\x00S)\x04\xe9\x01\x00\x00\x00c\x01\x00\x00\x00\x00\x00\x00\x00\x01\x00\x00\x00\x02\x00\x00\x00C\x00\x00\x00s\x0e\x00\x00\x00t\x00\x00|\x00\x00\x83\x01\x00\x01d\x00\x00S)\x01N)\x01\xda\x05print)\x01\xda\x01a\xa9\x00r\x04\x00\x00\x00\xfa\x13/home/aaa/proj/b.py\xda\x01f\x01\x00\x00\x00s\x02\x00\x00\x00\x00\x01r\x06\x00\x00\x00N)\x01r\x06\x00\x00\x00r\x04\x00\x00\x00r\x04\x00\x00\x00r\x04\x00\x00\x00r\x05\x00\x00\x00\xda\x08\x01\x00\x00\x00s\x00\x00\x00\x00'

[*]　　解释器逐个接收这些代码对象，并执行它们所代表的代码。

题外话
　　以下题外话摘录于网上，如果有什么地方不对，请指正。
　　现在关于解释和编译的界限也不是特别清晰了。
　　Java需要预先把代码编译成虚拟机指令的，然后在运行这些虚拟机指令，有的教科书上会成为混合型或者半编译型。
　　像Python和lua这样就更不好分了，可以直接解释源代码运行，也可以编译为虚拟机指令然后再运行。
　　php编译之后的结果可以被Web Server缓存起来，甚至还可以先被翻译为C++，然后再编译。
　　.NET 的CLR运行时是Windows的组成部分，编译好的.NET 系列语言的代码直接生成可执行文件，然后被“直接”执行，看起来跟C没有什么太大的差别。
　　JavaScript可以被V8引擎编译为机器码然后执行，如果在node.js下，这个编译结果被缓存起来了，你说这跟编译好再执行的C有什么区别？
　　编译型语言
　　1、编辑：用编辑软件（EDIT.EXE或记事本）形成源程序（.ASM）,如：LX.ASM;
　　2、汇编：用汇编程序（MASM.EXE）对源程序进行汇编，形成目标文件（.OBJ），格式如下：MASM LX.ASM;
　　3、连接：用连接程序（LINK.EXE）对目标程序进行连接，形成可执行文件（.EXE），格式如下：LINK LX.OBJ;
　　4、执行：如果结果在屏幕在显示，则直接执行可执行文件。
　　5、调试：用调试程序（DEBUG.EXE）对可执行文件进行调试，格式如下：DEBUG LX.EXE
　　目标代码由机器指令组成，一般不能独立运行，因为源程序中可能使用了某些汇编程序不能解释引用的库函数，而库函数代码又不在源程序中，此时还需要链接程序完成外部引用和目标模块调用的链接任务，最后输出可执行代码
　　如果对这个方向很感兴趣，那么下面的几篇文章可以进一步阅读：
　　http://python.jobbole.com/81660/
　　http://developer.iyunv.com/art/201309/410862.htm
　　http://developer.iyunv.com/art/201003/190924.htm

页: [1]

运维网's Archiver

解释型语言和编译型语言的不同以及Python如何运行