设为首页 收藏本站
查看: 1637|回复: 0

[经验分享] 【Python 3这件小事】 5.Python多线程学习

[复制链接]

尚未签到

发表于 2015-4-19 07:08:31 | 显示全部楼层 |阅读模式
  1.线程的创建
  多线程的使用在一些较为复杂的问题中十分常见,例如用爬虫爬取上亿条数据的情况下,单线程便不再适用啦,要想掌握多线程的使用,我们首先从线程的创建和使用开始。
  Python中使用线程有多种方式。
  
  1.1函数式:调用thread模块中的start_new_thread()函数来产生新线程。
  如下例:



# -*- coding: utf-8 -*-   
import thread   
def run_thread(n):   
for i in range(n):   
print i   
thread.start_new_thread(run_thread,(4,)) #参数一定是元组,两个参数可以写成(a,b)
  
  1.2 创建threading.Thread的子类来包装一个线程对象
  如下例,我们创建了两个进程:



from threading import Thread
import time
class race(Thread):
def __init__(self,threadname, interval):
Thread.__init__(self,name = threadname)
self.interval = interval
self.isrunning = True

def run(self):
while self.isrunning:
print 'thread %s is running, time: %s\n' %(self.getName(), time.ctime())
time.sleep(self.interval)
def stop(self):
self.isrunning = False
def test():
thead1 = race('A',1)
thead2 = race('B',2)
thead1.start()
thead2.start()
time.sleep(5)
thead1.stop()
thead2.stop()
if __name__ == '__main__':
test()
  在自己的线程类的__init__里调用threading.Thread.__init__(self, name = threadname). Threadname为线程的名字
  这种方法可以创建自己的线程类,必要时重写threading.Thread类的方法,线程的控制可以由自己定制。
  
  1.3 在threading.Thread中指定目标函数作为线程处理函数



# -*- coding: utf-8 -*-   
from threading import Thread   
def run_thread(n):   
for i in range(n):   
print i   
t1 = Thread(target=run_thread,args=(5,))#指定目标函数,传入参数,这里参数也是元组  
t1.start()  #启动线程  
  
  附: threading.Thread中常用函数说明

       函数名                                               功能
run()如果采用方法2创建线程就需要重写该方法
getName()获得线程的名称(方法2中有示例)
setName()设置线程的名称
start()启动线程
join(timeout) 在join()位置等待另一线程结束后再继续运行join()后的操作,timeout是可选项,表示最大等待时间
setDaemon(bool)True:当父线程结束时,子线程立即结束;False:父线程等待子线程结束后才结束。默认为False
isDaemon()判断子线程是否和父线程一起结束,即setDaemon()设置的值
isAlive() 判断线程是否在运行
  
  
  
  
  
  
  
  
  
  
  例:join()方法的使用
  我们通过一段代码来观察join()方法带来的改变:



# -*- coding: utf-8 -*-  
import threading
import time
class Mythread(threading.Thread):
def __init__(self,threadname):
threading.Thread.__init__(self, name = threadname)
def run(self):
time.sleep(2)
for i in range(5):
print '%s is running....' %self.getName()
t2 = Mythread('b')
t2.start()
#t2.join()
for i in range(5):
print 'the programing is running'
  如上例所示,我们把join()方法注释掉,这是一段普通的线程代码,它的运行结果如下:



the programing is running
the programing is running
the programing is running
the programing is running
the programing is running
b is running....
b is running....
b is running....
b is running....
b is running....
  此时,程序先运行主线程的程序,当主线程运行之后再运行B线程的内容。
  当我们把join()方法的注释符号去掉,即加入该方法后,会发生怎样的改变呢? 运行程序后结果如下:



b is running....
b is running....
b is running....
b is running....
b is running....
the programing is running
the programing is running
the programing is running
the programing is running
the programing is running
[Finished in 2.0s]
  可以看到,当join()加入后,当主线程运行到 t2.join() 时,它将等待 t2 运行完,然后再继续运行t2.join() 后的操作。
  
  2.线程的同步
  假设两个线程对象t1和t2都要对num=0进行增1运算,t1和t2都各对num修改10次,num的最终的结果应该为20。但是由于是多线程访问,有可能出现下面情况:在num=0时,t1取得num=0。系统此时把t1调度为”sleeping”状态,把t2转换为”running”状态,t2页获得num=0。然后t2对得到的值进行加1并赋给num,使得num=1。然后系统又把t2调度为”sleeping”,把t1转为”running”。线程t1又把它之前得到的0加1后赋值给num。这样,明明t1和t2都完成了1次加1工作,但结果仍然是num=1。
  上面的case描述了多线程情况下最常见的问题之一:数据共享。当多个线程都要去修改某一个共享数据的时候,我们需要对数据访问进行同步。
  学过操作系统的同学都知道,在操作系统中为了解决这一问题我们引入了锁机制,在python中同样如此。
  
  2.1 简单的线程同步
  最简单的同步机制就是“锁”。锁对象由threading.RLock创建。
    1.线程可以使用锁的acquire()方法获得锁,这样锁就进入“locked”状态。每次只有一个线程可以获得锁。
    2.如果当另一个线程试图获得这个锁的时候,就会被系统变为“blocked”状态,直到那个拥有锁的线程调用锁的release()方法来释放锁,这样锁就会进入“unlocked”状态。“blocked”状态的线程就会收到一个通知,并有权利获得锁。
    3.如果多个线程处于“blocked”状态,所有线程都会先解除“blocked”状态,然后系统选择一个线程来获得锁,其他的线程继续沉默(“blocked”)。
  
  Python中的thread模块和Lock对象是Python提供的低级线程控制工具,使用起来非常简单。如下例所示:



1 import thread  
2 import time  
3 mylock = thread.allocate_lock()  #Allocate a lock  
4 num=0  #Shared resource  
5   
6 def add_num(name):  
7     global num  
8     while True:  
9         mylock.acquire() #Get the lock   
10         # Do something to the shared resource  
11         print 'Thread %s locked! num=%s'%(name,str(num))  
12         if num >= 5:  
13             print 'Thread %s released! num=%s'%(name,str(num))  
14             mylock.release()  
15             thread.exit_thread()  
16         num+=1  
17         print 'Thread %s released! num=%s'%(name,str(num))  
18         mylock.release()  #Release the lock.  
19   
20 def test():  
21     thread.start_new_thread(add_num, ('A',))  
22     thread.start_new_thread(add_num, ('B',))  
23   
24 if __name__== '__main__':  
25     test()  
  
  Python 在thread的基础上还提供了一个高级的线程控制库,就是之前提到过的threading
  Python的threading module是在建立在thread module基础之上的一个module,在threading module中,暴露了许多thread module中的属性。
  在thread module中,python提供了用户级的线程同步工具“Lock”对象。而在threading module中,python又提供了Lock对象的变种: RLock对象。RLock对象内部维护着一个Lock对象,它是一种可重入的对象。
  对于Lock对象而言,如果一个线程连续两次进行acquire操作,那么由于第一次acquire之后没有release,第二次acquire将挂起线程。这会导致Lock对象永远不会release,使得线程死锁。
  RLock对象允许一个线程多次对其进行acquire操作,因为在其内部通过一个counter变量维护着线程acquire的次数。而且每一次的acquire操作必须有一个release操作与之对应,在所有的release操作完成之后,别的线程才能申请该RLock对象。
  下面来看看如何使用threading的RLock对象实现同步。



1 # -*- coding: utf-8 -*-  
2 import threading  
3 mylock = threading.RLock()  
4 num=0  
5   
6 class myThread(threading.Thread):  
7     def __init__(self, name):  
8         threading.Thread.__init__(self)  
9         self.t_name = name  
10           
11     def run(self):  
12         global num  #声明为全局变量
13         while True:  
14             mylock.acquire()  
15             print '/nThread(%s) locked, Number: %d'%(self.t_name, num)  
16             if num>=4:  
17                 mylock.release()  
18                 print '/nThread(%s) released, Number: %d'%(self.t_name, num)  
19                 break  
20             num+=1  
21             print '/nThread(%s) released, Number: %d'%(self.t_name, num)  
22             mylock.release()  
23               
24 def test():  
25     thread1 = myThread('A')  
26     thread2 = myThread('B')  
27     thread1.start()  
28     thread2.start()  
29   
30 if __name__== '__main__':  
31     test()  
  
  我们把修改共享数据的代码成为“临界区”。必须将所有“临界区”都封闭在同一个锁对象的acquire和release之间
  
  2.2 条件同步
  锁只能提供最基本的同步。假如只在发生某些事件时才访问一个“临界区”,这时需要使用条件变量Condition。
  Condition对象是对Lock对象的包装,在创建Condition对象时,其构造函数需要一个Lock对象作为参数,如果没有这个Lock对象参数,Condition将在内部自行创建一个Rlock对象。在Condition对象上,当然也可以调用acquire和release操作,因为内部的Lock对象本身就支持这些操作。但是Condition的价值在于其提供的wait和notify的语义
  条件变量是如何工作的呢?首先一个线程成功获得一个条件变量后,调用此条件变量的wait()方法会导致这个线程释放这个锁,并进入“blocked”状态,直到另一个线程调用同一个条件变量的notify()方法来唤醒那个进入“blocked”状态的线程。如果调用这个条件变量的notifyAll()方法的话就会唤醒所有的在等待的线程。
  如果程序或者线程永远处于“blocked”状态的话,就会发生死锁。所以如果使用了锁、条件变量等同步机制的话,一定要注意仔细检查,防止死锁情况的发生。对于可能产生异常的临界区要使用异常处理机制中的finally子句来保证释放锁。等待一个条件变量的线程必须用notify()方法显式的唤醒,否则就永远沉默。保证每一个wait()方法调用都有一个相对应的notify()调用,当然也可以调用notifyAll()方法以防万一。
  

运维网声明 1、欢迎大家加入本站运维交流群:群②:261659950 群⑤:202807635 群⑦870801961 群⑧679858003
2、本站所有主题由该帖子作者发表,该帖子作者与运维网享有帖子相关版权
3、所有作品的著作权均归原作者享有,请您和我们一样尊重他人的著作权等合法权益。如果您对作品感到满意,请购买正版
4、禁止制作、复制、发布和传播具有反动、淫秽、色情、暴力、凶杀等内容的信息,一经发现立即删除。若您因此触犯法律,一切后果自负,我们对此不承担任何责任
5、所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其内容的准确性、可靠性、正当性、安全性、合法性等负责,亦不承担任何法律责任
6、所有作品仅供您个人学习、研究或欣赏,不得用于商业或者其他用途,否则,一切后果均由您自己承担,我们对此不承担任何法律责任
7、如涉及侵犯版权等问题,请您及时通知我们,我们将立即采取措施予以解决
8、联系人Email:admin@iyunv.com 网址:www.yunweiku.com

所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其承担任何法律责任,如涉及侵犯版权等问题,请您及时通知我们,我们将立即处理,联系人Email:kefu@iyunv.com,QQ:1061981298 本贴地址:https://www.yunweiku.com/thread-58514-1-1.html 上篇帖子: Python下用Tkinter进行GUI编程 下篇帖子: Python函数式编程指南(二):函数
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

扫码加入运维网微信交流群X

扫码加入运维网微信交流群

扫描二维码加入运维网微信交流群,最新一手资源尽在官方微信交流群!快快加入我们吧...

扫描微信二维码查看详情

客服E-mail:kefu@iyunv.com 客服QQ:1061981298


QQ群⑦:运维网交流群⑦ QQ群⑧:运维网交流群⑧ k8s群:运维网kubernetes交流群


提醒:禁止发布任何违反国家法律、法规的言论与图片等内容;本站内容均来自个人观点与网络等信息,非本站认同之观点.


本站大部分资源是网友从网上搜集分享而来,其版权均归原作者及其网站所有,我们尊重他人的合法权益,如有内容侵犯您的合法权益,请及时与我们联系进行核实删除!



合作伙伴: 青云cloud

快速回复 返回顶部 返回列表