|
0.说明
学习Python其实也有好一段时间了,之前也做了不少笔记,但是要真正把Python学得很扎实,没有对Python系统的了解是远远不够的,哪怕是最基础的知识点,所以决定好好地回顾整理。
当然,就以《Python核心编程》这本书为纲,希望可以把自己对Python的理解连成系统的一条线。
1.语句和语法
- `#`:注释
- `\`:换行,如果是闭合操作符如`( )`,`[ ]`,`{ }`等,可以不使用`\`
- `:`:分号将代码头和代码体分开
- `缩进`:用以区分不同的代码块
- `;`:同一行写多个语句,但不建议
- `模块`:一个.py脚本文件就是一个模块
2.变量赋值
(1)赋值操作符:=
- 在Python中,对象是通过引用传递的,赋值时,是将该对象的引用(不是一个值)赋给这个变量。
- 另外,Python赋值语句没有返回值,但可以使用赋值链:
>>> a = (a = 3)
File "<stdin>", line 1
a = (a=3)
^
SyntaxError: invalid syntax
>>> y = x = 3
(2)增量赋值
- 只有类似+=这样的增量赋值,没有自增自减的方法
- 特性:可变对象(列表,字典等)就修改(无需拷贝引用),不可变对象(数字,元组等)则分配一个新对象
(3)多重赋值
- 一个对象可被多个变量引用,多个对象也可被多个对象引用
>>> x = y = z =1 (4)多元赋值:元组赋值
>>> (x, y, z) = (1, 2, 'a string')
>>> x = 3; y = 4
>>> print x, y
3 4
>>> x, y = y, x
>>> print x, y
4 3
3.标识符
- 关键字标识符:保留字,不能用于其他用途,否则会引起SyntaxError异常
- 内建(built-in)标识符:是__builtins__模块的成员,在程序开始或交互解释器开始时,由Python解释器自动导入,可以将其作为Python全局变量,可以重新赋值,但不建议
>>> dir
<built-in function dir>
>>> dir()
['__builtins__', '__doc__', '__name__', '__package__']
- __专用下划线标识符:
__xxx:类中的私有变量名,不能用`from module import *`导入,变量是私有时,建议使用这种方法
__xxx__:系统定义名字,如内建标识符
另外,Pythonn不支持标识符重载,所以任何时刻都只有一个名字绑定。
4.基本风格指南
- 注释:#号
- 文档:模块,类声明或函数声明中第一个没有赋值的字符串,可通过obj.__doc__访问
- 缩进:以空格代替制表符
- 标识符名称:名字简短有意义
- Python风格指南:import this
(1)模块结构和布局
#/usr/bin/env python 这样仅输入脚本名字就可以执行脚本,无需直接调用解释器。
''this is a test module'' 可通过obj.__doc__访问
- 模块导入
- 变量定义:尽量使用局部变量代替全局变量
- 类定义
- 函数定义
- 主程序
if __name__ == '__main__':
My_function()
#如果模块是被导入,__name__的值为模块名字;
#如果模块是被直接执行,__name__的值为'__main__';
关于主程序,注意下面几点:
- 1.绝大部分模块创建的目的是被其它模块导入而不是作为脚本执行,总之只有一个模块,也就是包含主程序的模块会被执行;
- 2.最高级别的Python语句(没有缩进)在模块被导入时就会被执行;
- 3.通常只有主程序模块中有大量的顶级可执行代码,所有其他被导入模块只应该有很少的顶级执行代码,所有的功能代码都应该封装在函数或类当中。
对于上面三点,只要联系自己在实际项目开发中的例子就可以很好的理解了。
(2)在主程序中书写测试代码
如果想测试被导入的模块的某个函数的功能,就可以使用主程序的方法,引入并执行该函数,这就是测试功能的使用,当然在大型程序中,更倾向使用unittest。
5.内存管理
- 变量定义:变量无须事先声明
在Python中无需显式变量声明语句,变量在第一次赋值时自动声明。
- 动态类型:变量无须指定类型
Python中对象的类型和内存占用都是运行时确定的。
- 内存分配:不用关心内存管理
Python解释器承担了内在管理的复杂任务。
- 引用计数:对象回收
(1)增加引用计数
- 当对象被创建并(将其引用)赋值给变量时,该对象的引用计数就被设置为1
- 当一个对象(的引用)又被赋值给其他变量时,或作为参数传递给函数,方法或类实例时,或者被赋值为一个窗口对象(列表,字典等)的成员时,该对象新的一个引用会被创建,引用计数加1
>>> x = 3.14 #加1,下面每一步同理
>>> y = x
>>> foobar(x)
>>> myList = [123, x, 'xyz']
(2)减少引用计数
- 一个本地引用离开其作用范围
如函数执行完毕后局部变量被销毁。
- 对象别名被显式销毁
>>> del y
- 当变量被赋值给另外一个对象时,原对象的引用计数也会自动减1
>>> foo = 'xyz'
>>> bar = foo
>>> foo = 123
myList.remove(x)
del myList 即执行del y会产生下面两个结果:
- 1.从现在名称空间中删除y
- 2.y变量对应的对象的引用计数减1
需要注意的是,如果内存中仍然有在使用该对象,这会增加一个额外的引用,则它还不会被回收。
解释器跟踪对象的引用计数,垃圾收集器负责释放内存。其实际,垃圾收集器是一块独立代码,用来查找引用计数为0的对象和那些引用计数虽然大于0但也应该被销毁的对象(如循环引用的对象)。
垃圾收集器 = 引用计数器 + 循环垃圾计数器,这在存在循环引用的情况中非常有用:
- 循环引用:发生在至少两个对象互相引用时,也就是当其它所有对它们的引用都消失时,他们两者所产生的对各自的引用仍然存在,例如两个类中有各自的一个实例
- 引用计数器作用:当一个对象的引用计数变为0,解释器会暂停,释放掉这个对象和仅有这个对象可访问(可到达的)其它对象(这样的话,其它对象的引用计数必然是1)
- 循环垃圾计数器作用:作为引用计数器的补充,垃圾收集器也会留心被分配的总量很大的(及未通过引用计数销毁的那些)对象,在这种情况下,解释器也会停下来,试图清理所有未引用的循环
基本可以理解,但具体怎么实现的,就需要看Python的源码分析了。
6.第一个Python程序
主要提及一点:使用局部变量替换模块变量。
例如,你要使用os.linesep,如果你多次使用,那么建议将其定义为一个本模块的全局变量或局部变量,这将会加快查询的速度,因为对于os.linesep,要进行下面两步:
- 首先要查找os,确认其是一个模块
- 在这个模块中查找linesep变量
将经常用到的模块属性替换为一个本地引用,可以让程序跑得更快。
|
|
|