【Python 3这件小事】 5.Python多线程学习

191145686 · 发表于 2015-4-19 07:08:31

　　1.线程的创建
　　多线程的使用在一些较为复杂的问题中十分常见，例如用爬虫爬取上亿条数据的情况下，单线程便不再适用啦，要想掌握多线程的使用，我们首先从线程的创建和使用开始。
　　Python中使用线程有多种方式。
　　
　　1.1函数式：调用thread模块中的start_new_thread()函数来产生新线程。
　　如下例：

# -*- coding: utf-8 -*-
import thread
def run_thread(n):
for i in range(n):
print i
thread.start_new_thread(run_thread,(4,)) #参数一定是元组，两个参数可以写成（a,b）
　　
　　1.2 创建threading.Thread的子类来包装一个线程对象
　　如下例，我们创建了两个进程：

from threading import Thread
import time
class race(Thread):
def __init__(self,threadname, interval):
Thread.__init__(self,name = threadname)
self.interval = interval
self.isrunning = True

def run(self):
while self.isrunning:
print 'thread %s is running, time: %s\n' %(self.getName(), time.ctime())
time.sleep(self.interval)
def stop(self):
self.isrunning = False
def test():
thead1 = race('A',1)
thead2 = race('B',2)
thead1.start()
thead2.start()
time.sleep(5)
thead1.stop()
thead2.stop()
if __name__ == '__main__':
test()
　　在自己的线程类的__init__里调用threading.Thread.__init__(self, name = threadname). Threadname为线程的名字
　　这种方法可以创建自己的线程类，必要时重写threading.Thread类的方法，线程的控制可以由自己定制。
　　
　　1.3 在threading.Thread中指定目标函数作为线程处理函数

# -*- coding: utf-8 -*-
from threading import Thread
def run_thread(n):
for i in range(n):
print i
t1 = Thread(target=run_thread,args=(5,))#指定目标函数，传入参数，这里参数也是元组
t1.start() #启动线程
　　
　　附： threading.Thread中常用函数说明

函数名	功能
run()	如果采用方法2创建线程就需要重写该方法
getName()	获得线程的名称(方法2中有示例)
setName()	设置线程的名称
start()	启动线程
join(timeout)	在join()位置等待另一线程结束后再继续运行join()后的操作,timeout是可选项，表示最大等待时间
setDaemon(bool)	True:当父线程结束时，子线程立即结束；False:父线程等待子线程结束后才结束。默认为False
isDaemon()	判断子线程是否和父线程一起结束，即setDaemon()设置的值
isAlive()	判断线程是否在运行

　　
　　
　　
　　
　　
　　
　　
　　
　　
　　
　　例：join()方法的使用
　　我们通过一段代码来观察join()方法带来的改变：

# -*- coding: utf-8 -*-
import threading
import time
class Mythread(threading.Thread):
def __init__(self,threadname):
threading.Thread.__init__(self, name = threadname)
def run(self):
time.sleep(2)
for i in range(5):
print '%s is running....' %self.getName()
t2 = Mythread('b')
t2.start()
#t2.join()
for i in range(5):
print 'the programing is running'
　　如上例所示，我们把join()方法注释掉，这是一段普通的线程代码，它的运行结果如下：

the programing is running
the programing is running
the programing is running
the programing is running
the programing is running
b is running....
b is running....
b is running....
b is running....
b is running....
　　此时，程序先运行主线程的程序，当主线程运行之后再运行B线程的内容。
　　当我们把join()方法的注释符号去掉，即加入该方法后，会发生怎样的改变呢？运行程序后结果如下：

b is running....
b is running....
b is running....
b is running....
b is running....
the programing is running
the programing is running
the programing is running
the programing is running
the programing is running
[Finished in 2.0s]
　　可以看到，当join()加入后，当主线程运行到 t2.join() 时，它将等待 t2 运行完，然后再继续运行t2.join() 后的操作。
　　
　　2.线程的同步
　　假设两个线程对象t1和t2都要对num=0进行增1运算，t1和t2都各对num修改10次，num的最终的结果应该为20。但是由于是多线程访问，有可能出现下面情况：在num=0时，t1取得num=0。系统此时把t1调度为”sleeping”状态，把t2转换为”running”状态，t2页获得num=0。然后t2对得到的值进行加1并赋给num，使得num=1。然后系统又把t2调度为”sleeping”，把t1转为”running”。线程t1又把它之前得到的0加1后赋值给num。这样，明明t1和t2都完成了1次加1工作，但结果仍然是num=1。
　　上面的case描述了多线程情况下最常见的问题之一：数据共享。当多个线程都要去修改某一个共享数据的时候，我们需要对数据访问进行同步。
　　学过操作系统的同学都知道，在操作系统中为了解决这一问题我们引入了锁机制，在python中同样如此。
　　
　　2.1 简单的线程同步
　　最简单的同步机制就是“锁”。锁对象由threading.RLock类创建。
　　　　1.线程可以使用锁的acquire()方法获得锁，这样锁就进入“locked”状态。每次只有一个线程可以获得锁。
　　　　2.如果当另一个线程试图获得这个锁的时候，就会被系统变为“blocked”状态，直到那个拥有锁的线程调用锁的release()方法来释放锁，这样锁就会进入“unlocked”状态。“blocked”状态的线程就会收到一个通知，并有权利获得锁。
　　　　3.如果多个线程处于“blocked”状态，所有线程都会先解除“blocked”状态，然后系统选择一个线程来获得锁，其他的线程继续沉默（“blocked”）。
　　
　　Python中的thread模块和Lock对象是Python提供的低级线程控制工具，使用起来非常简单。如下例所示：

1 import thread
2 import time
3 mylock = thread.allocate_lock()  #Allocate a lock
4 num=0  #Shared resource
5
6 def add_num(name):
7    global num
8    while True:
9       mylock.acquire() #Get the lock
10       # Do something to the shared resource
11       print 'Thread %s locked! num=%s'%(name,str(num))
12       if num >= 5:
13          print 'Thread %s released! num=%s'%(name,str(num))
14          mylock.release()
15          thread.exit_thread()
16       num+=1
17       print 'Thread %s released! num=%s'%(name,str(num))
18       mylock.release()  #Release the lock.
19
20 def test():
21    thread.start_new_thread(add_num, ('A',))
22    thread.start_new_thread(add_num, ('B',))
23
24 if __name__== '__main__':
25    test()
　　
　　Python 在thread的基础上还提供了一个高级的线程控制库，就是之前提到过的threading。
　　Python的threading module是在建立在thread module基础之上的一个module，在threading module中，暴露了许多thread module中的属性。
　　在thread module中，python提供了用户级的线程同步工具“Lock”对象。而在threading module中，python又提供了Lock对象的变种: RLock对象。RLock对象内部维护着一个Lock对象，它是一种可重入的对象。
　　对于Lock对象而言，如果一个线程连续两次进行acquire操作，那么由于第一次acquire之后没有release，第二次acquire将挂起线程。这会导致Lock对象永远不会release，使得线程死锁。
　　RLock对象允许一个线程多次对其进行acquire操作，因为在其内部通过一个counter变量维护着线程acquire的次数。而且每一次的acquire操作必须有一个release操作与之对应，在所有的release操作完成之后，别的线程才能申请该RLock对象。
　　下面来看看如何使用threading的RLock对象实现同步。

1 # -*- coding: utf-8 -*-
2 import threading
3 mylock = threading.RLock()
4 num=0
5
6 class myThread(threading.Thread):
7    def __init__(self, name):
8       threading.Thread.__init__(self)
9       self.t_name = name
10
11    def run(self):
12       global num  #声明为全局变量
13       while True:
14          mylock.acquire()
15          print '/nThread(%s) locked, Number: %d'%(self.t_name, num)
16          if num>=4:
17                mylock.release()
18                print '/nThread(%s) released, Number: %d'%(self.t_name, num)
19                break
20          num+=1
21          print '/nThread(%s) released, Number: %d'%(self.t_name, num)
22          mylock.release()
23
24 def test():
25    thread1 = myThread('A')
26    thread2 = myThread('B')
27    thread1.start()
28    thread2.start()
29
30 if __name__== '__main__':
31    test()
　　
　　我们把修改共享数据的代码成为“临界区”。必须将所有“临界区”都封闭在同一个锁对象的acquire和release之间。
　　
　　2.2 条件同步
　　锁只能提供最基本的同步。假如只在发生某些事件时才访问一个“临界区”，这时需要使用条件变量Condition。
　　Condition对象是对Lock对象的包装，在创建Condition对象时，其构造函数需要一个Lock对象作为参数，如果没有这个Lock对象参数，Condition将在内部自行创建一个Rlock对象。在Condition对象上，当然也可以调用acquire和release操作，因为内部的Lock对象本身就支持这些操作。但是Condition的价值在于其提供的wait和notify的语义。
　　条件变量是如何工作的呢？首先一个线程成功获得一个条件变量后，调用此条件变量的wait()方法会导致这个线程释放这个锁，并进入“blocked”状态，直到另一个线程调用同一个条件变量的notify()方法来唤醒那个进入“blocked”状态的线程。如果调用这个条件变量的notifyAll()方法的话就会唤醒所有的在等待的线程。
　　如果程序或者线程永远处于“blocked”状态的话，就会发生死锁。所以如果使用了锁、条件变量等同步机制的话，一定要注意仔细检查，防止死锁情况的发生。对于可能产生异常的临界区要使用异常处理机制中的finally子句来保证释放锁。等待一个条件变量的线程必须用notify()方法显式的唤醒，否则就永远沉默。保证每一个wait()方法调用都有一个相对应的notify()调用，当然也可以调用notifyAll()方法以防万一。
　　

账号		自动登录	找回密码
密码			立即注册

大疆运维招人啦，

C++ :try 语句块和异常处理

C++的多态

Red Hat RHCE 8 (EX294) Cert Guide

Java/C++ 区别：看完这一篇，就够用！

别再用过时库了！这 13 个顶级 C++ 库才是

c++ size_t 和 int 的区别

[经验分享] 【Python 3这件小事】 5.Python多线程学习

浏览过的版块

扫码加入运维网微信交流群