python一些重要但不熟悉的语法
注解这部分很基础,但自己还不是十分熟悉,所要要特别注意.
[*]
raw string
[*]
例如, s = r"hello world\n", 那么此处相当于 s = "hello world\\n"` 也就是说,转义失去意义,只保留**原始(raw)**的字符
[*]
还有就是常用于*正则表达式*中,如
1
2
3
4
5
6
import re
s = "hello world"
rx = re.compile("[^ ]* (*)")
result = rx.sub(r"\1 is mine", s) #输出为 *world is mine*
#如果上面不使用r打头的字符串,则可使用如下替换:
result = rx.sub("\\1 is mine", s)
[*]
三单引号字符串
[*]
常用于多行的字符串,如
s = '''hello, this is
Mrs. Brown.'''
print s # 输出为二行的字符串
[*]
字符串逆转
注解
要得到一个字符串的逆序,可直接使用[]操作,如:
1
2
3
4
5
6
7
8
s = "zhutao"
t = s[::-1]
#操作方法是,如果第三个选项为负数,即此处的-1,则表明采用逆转,那么,则从原字符串的最后一个字符开始,以此处的数为步进(step)来操作,得到结果,此处得到 oatuhz
t = s[::-2]
# 此处得到 t= 'oth'
t = s[::3]
# 此处得到 t = 'zt'
t = s #返回oatu
注意:list, tuple也适应此种操作.
[*]字符代码转换(char<->int)
注解
[*]ord: 把一个字符转换为对应的ASCII整数代码
[*]chr: 与ord相反,把一个ASCII整数代码转换为对应的字符
控制流相关¶
while语句
[*]
除了通常的while语法以外,还允许条件不为真时(即跳出while语句时)执行else语句,如:
1
2
3
4
5
6
i = 10
while i > 0:
print i
i -= 1
else:
print "i is less than 0" #输出为:10 9 8 7 6 5 4 3 2 1 i is less than 0
注解
如果在while循环体中使用break提前中断循环,则else不会执行
同样for语句也有类似的else分支语法
数据结构¶
字典
[*]
注意的是,如果引用某个键重新赋值时,当此键不存在时,则会 自动添加一个新键-值 如:
x = {"name":"zhutao"}
x['name'] = "yaya"# x = {'name':'yaya'}
x ['age'] = 24 # x = {'age':24, 'name':'yaya'}
赋值操作¶
注解
赋值操作只是复制了一次 引用(reference) 而不是拷贝,即二者 依旧指向同一个内存地址
所以,
1
2
3
4
5
x =
y = x # 此时,x,y指向同一块内存
del y
print x #
print y #
因而,要真正创建一个新的对象时,需要使用**切片操作**,即 y = x[:]
类的变量和对象的变量¶
注解
类的变量,是指在类的定义中以类名来引用的变量,此变量 在各个实例中是共享的 , 相当于c++类中的静态变量
对象变量,是指在类的定义中以self来引用的变量,此变量 在各个实例中是独立的,各自有自己的存储空间
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
class Person:
population = 0
def __init__(self, name):
self.name = name #对象的变量,为各个实例单独引用
Person.population += 1#类的变量,在各个实例中共享
#注:此处也可以使用 ``self.__class__.population += 1`` 替代,实现相同功能
def __del__(self):
print "%s says goodbye" % self.name
Person.population -= 1
if Person.population == 0:
print "I am the last one here"
else:
print "we have %d persons left" % Person.population
def howMany(self):
if Person.population == 1:
print "I am the only person here"
else:
print "There are %d persons here" % Person.population
zhutao = Person("zhutao")
zhutao.howMany()
yaya = Person("yaya")
yaya.howMany()
#输出结果为:
#I am the only person here
#There are 2 persons here
#zhutao says goodbye. we have 1 persons left
#yaya says goodbye. I am the last one.
异常处理¶
注解
对于某些即使发生异常,某些操作仍须执行时,可采用try...finally语句,例如:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
import time
fh = file("test.data")#假设存在文件test.data
try:
while(True):
line = fh.readline()
if len(line) == 0:#认为文件结束
break
print line,
time.sleep(2)
finally:
fh.close()
print "file has been closed!"
#所以在执行过程中,如果在执行完毕前,按了ctrl+c中止目前程序的运行
#fh.close()文件关闭动作依然会得以执行
类中的特殊语法¶
特殊函数
相关说明
__init__(self, ..)
相当于c/c++中的构造函数,这个方法在新建对象恰好要被返回使用之前被调用
__del__(self)
相当于c/c++中的析构函数,这个方法在对象删除之前被调用
__str__(self)
在我们对对象使用print语句或者使用str()时调用
__lt__(self, other)
当使用 小于 运算符(<)调用,类似地,对于所有的运算符都有特殊的方法
__getitem__(self,key)
使用x索引操作时调用
__len__(str)
对序列对象使用内建的len()函数时调用
可变长参数函数的使用¶
注解
这是Python一个非常强大的功能,可使用元组(tuple)和字典(dict)两种变长参数函数. 如:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
def max(*args):
m = args
for s in args:
if m<s:
m = s
return m
def test(**argv):
for k,v in argv.items():
print k,v
#那么在调用时,可按如下方法
max(1,2,3,0)
max(3,4)
test(name="zhutao", age=24)
test(x = 1, y=2, z=3)
lambda语法¶
注解
lambda语法只能使用单个表达式作为函数体,而通常的语句是不能出现在lambda函数体中的,如print函数
1
2
3
4
5
6
def make_repeater(n):
return lambda s: s*n #此处的函数体只是一个表达式,而且返回的是一个函数
twice = make_repeater(2) #那么此处twice即是一个函数
print twice('world')
print twice(5)
[*]lambda函数是一个表达式,而不是一个语句
[*]lambda函数:之后只能有一个表达式,亦即此处只能是一个返回值
[*]lambda函数虽然不能使用if, while等语句,但可以使用布尔短路来实现if,使用map来实现循环等, 如 `x and func(a) or func(b), 即,如果x为真则返回func(a),否则返回func(b)
嵌套函数¶
注解
嵌套函数适用于nested scope,即嵌套作用域,嵌套函数可以使用被嵌套函数的相关局部变量,如
1
2
3
4
5
6
7
8
9
10
def f():
x = 8
def f2():
x = 3
print x
return f2 #返回函数
printx = f()
printx()
#此时输出为3,即在嵌套函数中改变了x的值,此语句也可写为 ``f()()``
exec和eval¶
注解
exec用来执行储存在字符串中的Python语句,我们可以在运行时动态生成一个python代码的字符串,从而使用exec执行. 如,
exec("print 'hello world'")
#输出为hello world
eval用来计算存储在字符串中的Python表达式,如
eval("2*3") #输出6
assert语句¶
注解
用于声明某个条件是真的.如果此条件不为真,则会引起一个错误,即AssertionError. 如:
1
2
3
4
5
6
7
mylist = ['item']
assert len(mylist)>=1 #不为真则会引发AssertionError
mylist.pop()
assert len(mylist)>=1 #引发AssertionError
eval('2*3')
#输出为6
getattr的分发作用¶
注解
getattr具有分发对象属性的作用,可以间接地使用此方法来使用相关接口. 如:
d = {"name":"zhutao", "age":24}
getattr(d, "get")("name") #此时则返回的是zhutao,相当于d.get("name")
此方法同样可以使用在module,对象等
类中的私有属性¶
注解
在Python中类中的私有属性,通常是采用命名的方式来加以区分,即在属性前加 2个下划线
但,此处的私有并非绝对私有,它只是一种习惯上的私有,而非强迫的私有,可以使用如下方式访问:
1
2
3
4
5
6
7
class test:
def __hello(self):#习惯上的私有,而非强迫
print "hello"
x = test()
x.__hello() #报错,"test中无此方法"
x._test__hello() #正常输出hello, 但在实际代码中不要这么使用
松散(verbose)的正则表达式¶
注解
python默认使用紧凑的正则表达式(即普通的正则表达式),但为了提高正则表达式的可读性,我们可以使用松散的,如:
1
2
3
4
5
6
7
8
9
10
11
12
import re
pattern = """
^ #匹配开始
{3,4} #匹配3个或者4个数字
-? #匹配0个或者1个-符号
{7,8} #匹配7个或者8个数字
$ #匹配结束
"""
#很显然上面的匹配式是用来匹配诸如029-82682345这样的中国电话号码的
re.search(pattern, '029-3456789', re.VERBOSE)
#注意:此处的re.VERBOSE是用来标记此处用到的正则表达式是松散的,如果不加则会匹配失败
8进制与16进制¶
注解
在python中可以使用8进制和16进制的整数,使用方法如下:
octal = 0123 #以0打头的整数,python认为其为8进制数
hex = 0x123 #以0x或者0X打头的整数,python认为其为16进制数
Hex = 0X123
但在使用过程中,python会自动将其转换为10进制表达. 也可以使用oct,hex函数来显式得到十进制数的字符表达( 返回的是str类型 )
a = 255 #十进制整数
b = hex(a) #转换为16进制字符串
c = int(b, 16)#将b又转换为十进制整数
names, reference and objects¶
注解
python是一种动态类型语言,无需事前声明一个变量的类型. 例如, a = 3 这条语句,在python中发生了如下几个步骤:
[*]生成一个表示3的对象
[*]生成变量a,如果a不存在
[*]将变量a 链接 到新的对象3
此时a则是对象3的一个引用(reference),在python内部采用指针来实现. 类型信息存放于对象中,而非变量中,所以,
1
2
3
4
5
a = 23
a =
a = "spam"
#在python中,只是a分别指向了不同的三个对象,而a本身是没有类型的
#对象除了相关数据外,还通常包括:类型域,引用计数(即,多少个变量来引用自己)
那么在指向了另一个对象后,前一个对象如何处理?
因为对象本身有个引用计数域,所以当对象自己的引用计数为0时,则自动回收该对象,如上述中的23,
http://scm002.iteye.com/admin/blogs/_images/names-reference-object.JPG
==和is¶
注解
在python中可以用来判断二个变量是否 相等 的操作符,区别如下:
[*]
== 是比较二个变量的值(即二个变量所引用的对象的值)是否相等
[*]
is 是比较二个变量所指的对象是否相同
1
2
3
4
5
6
7
a =
b = a
a==b # True
a is b # True
c =
a==c # True
a is c # False
但是对于一小整数或者短的字符串,系统不会立即回收其对象的内存,而是进行了缓存(cache)留待后用,如:
a = 42
b = 42
a == b# True
a is b# True, 42被复用
可以使用sys.getrefcount(object)来得到一个对象的引用计数. 因为整数和字符串是不可更改的对象,所以大量的引用并不成问题,这样也能够提高性能.
关于增量赋值¶
注解
增量赋值指的是使用”+=”操作符的一种操作.
[*]对于 不可更改(immutable) 的对象,如int,string,tuple等, s += a, 就等于 s=s+a, s+a会生成一个新的对象, 而s是对此新对象的一个引用
[*]对于 可更改(mutable) 的对象,如list, dict等, s += a,则不会生成新对象,是对s 就地(in place) 更新, 如list, s+=a 相当于 s.extend(a), 那么改变a中的值会影响到新的s的值.
generator object相关¶
enumerate方法¶
注解
在遍历一个iterable对象时,通常需要获得值和偏移量(value and offset), 可以使用位置计数, 但更常用的是enumerate.
a = "spam"
for (offset, value) in enumerate(a):
print value, ' appears at offset', offset
enumerate每次返回的是一个(offset, value)的tuple,它是一种generator对象
常见的错误¶
关于append, update等函数¶
注解
对于list, dict等类型,属于它们的方法如append, extend, update等,它们的返回值为None,而不是变量本身,如:
a =
a.append(3) # a =
a = a.append(4) # a = None
with as 语句¶
注解
此处只在2.6之后的版本可用。
with open("filename.txt", "w") as myfile:
for line in myfile:
print line
#在整个执行过程,无论open是否产生异常,myfile最终都会关闭
关于context management protocol
注解
这是支持with..as..语句的协议,即实现__enter__,__exit__ 如:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
class TraceBlock:
def message(self, arg):
print 'running', arg
def __enter__(self):
print "starting with block"
return self
def __exit__(self, exec_type, exec_value, exec_tb):
if exec_type is None:
print "exit normally." # no exception
else:
print 'raise an exception', exec_type
return False #传播异常
with TraceBlock() as action:
action.message("test 1")
print "reached"
with TraceBlock() as action:
action.message("test 2")
raise TypeError
print "not reached"
注解
#本质上说
with EXPR as VAR
BLOCK
#等价于
mgr = (EXPR)
exit = mgr.__exit__# Not calling it yet
value = mgr.__enter__()
exc = True
try:
try:
VAR = value# Only if "as VAR" is present
BLOCK
except:
# The exceptional case is handled here
exc = False
if not exit(\*sys.exc_info()):
raise
# The exception is swallowed if exit() returns true
finally:
# The normal and non-local-goto cases are handled here
if exc:
exit(None, None, None)
如果上述代码中的as VAR部分没有,则VAR=部分也就没有,但mgr等依旧存在。更多请参考: PEP343
页:
[1]