Python学习笔记__10.2章多线程

快乐的老鼠 发表于 2018-8-10 08:29:24

　　# 这是学习廖雪峰老师python教程的学习笔记
　　1、概览
　　多任务可以由多进程完成，也可以由一个进程内的多线程完成。进程是由若干线程组成的，一个进程至少有一个线程。
　　由于线程是操作系统直接支持的执行单元，因此，高级语言通常都内置多线程的支持，Python也不例外，并且，Python的线程是真正的Posix Thread，而不是模拟出来的线程。
　　Python的标准库提供了两个模块：_thread和threading。_thread是低级模块。threading是高级模块，对_thread进行了封装。绝大多数情况下，我们只需要使用threading这个高级模块。
　　1.1、创建一个线程
　　启动一个线程就是把一个函数传入并创建Thread实例，然后调用start()开始执行：
　　import time, threading
　　# 新线程执行的代码:
　　def loop():
　　print('thread %s is running...' % threading.current_thread().name) #打印当前线程实例，此函数体内，都为LoopThread
　　n = 0
　　while n < 5:
　　n = n + 1
　　print('thread %s >>> %s' % (threading.current_thread().name, n))
　　time.sleep(1)
　　print('thread %s ended.' % threading.current_thread().name)
　　print('thread %s is running...' % threading.current_thread().name) #打印当前线程实例，此处为MainThread
　　t = threading.Thread(target=loop, name='LoopThread') # 线程执行loop()函数，线程名为‘LoopThread’
　　t.start() #启动线程
　　t.join()#等待线程运行完毕
　　print('thread %s ended.' % threading.current_thread().name)
　　threading模块的current_thread()函数，它永远返回当前线程的实例。主线程实例的名字叫MainThread，子线程的名字在创建时指定。如果不指定Python就自动给线程命名为Thread-1，Thread-2……
　　2、Lock
　　多线程和多进程最大的不同在于，多进程中，同一个变量，各自有一份拷贝存在于每个进程中，互不影响，而多线程中，所有变量都由所有线程共享，所以，任何一个变量都可以被任何一个线程修改，因此，线程之间共享数据最大的危险在于多个线程同时改一个变量，把内容给改乱了。
　　2.1、更改全局变量balance
　　import time, threading
　　balance = 0
　　lock = threading.Lock() # threading.Lock()，创建一个锁
　　def change_it(n):
　　# 先加后减，结果应该为0:
　　global balance
　　balance = balance + n
　　balance = balance - n
　　def run_thread(n):
　　for i in range(100000):
　　# 先要获取锁:
　　lock.acquire()
　　try:
　　# 进行修改:
　　change_it(n)
　　finally:
　　# 改完了一定要释放锁:
　　lock.release()
　　t1 = threading.Thread(target=run_thread, args=(5,))#创建线程，让t1指向这个线程
　　t2 = threading.Thread(target=run_thread, args=(8,))#创建线程，让t2指向这个线程
　　t1.start()
　　t2.start()
　　t1.join()
　　t2.join()
　　print(balance)
　　当多个线程同时执行lock.acquire()时，只有一个线程能成功地获取锁，然后继续执行代码，其他线程就继续等待直到获得锁为止
　　锁的好处：

[*]　　是确保了某段关键代码只能由一个线程从头到尾完整地执行
　　锁的坏处：

[*]　　阻止了多线程并发执行，包含锁的某段代码实际上只能以单线程模式执行，效率就大大地下降了。
[*]　　由于可以存在多个锁，不同的线程持有不同的锁，并试图获取对方持有的锁时，可能会造成死锁，导致多个线程全部挂起，既不能执行，也无法结束，只能靠操作系统强制终止。
　　3、多核CPU
　　3.1、死循环测试CPU 使用率
　　import threading, multiprocessing
　　def loop():# 死循环
　　x = 0
　　while True:
　　x = x ^ 1
　　for i in range(multiprocessing.cpu_count()): # multiprocessing.cpu_count()=cpu 逻辑核数量
　　t = threading.Thread(target=loop)
　　t.start()
　　启动与CPU核心数量相同的N个线程，在4核CPU上可以监控到CPU占用率仅有102%，也就是仅使用了一核。
　　用C、C++或Java来改写相同的死循环，直接可以把全部核心跑满。但Python不行
　　因为Python的线程虽然是真正的线程，但解释器执行代码时，有一个GIL锁：Global Interpreter Lock，任何Python线程执行前，必须先获得GIL锁，然后，每执行100条字节码，解释器就自动释放GIL锁，让别的线程有机会执行。这个GIL全局锁实际上把所有线程的执行代码都给上了锁，所以，多线程在Python中只能交替执行，即使100个线程跑在100核CPU上，也只能用到1个核
　　Python虽然不能利用多线程实现多核任务，但可以通过多进程实现多核任务。多个Python进程有各自独立的GIL锁，互不影响。
　　4、小结
　　多线程编程，模型复杂，容易发生冲突，必须用锁加以隔离，同时，又要小心死锁的发生。
　　Python解释器由于设计时有GIL全局锁，导致了多线程无法利用多核。多线程的并发在Python中就是一个美丽的梦。

页: [1]

运维网's Archiver

Python学习笔记__10.2章 多线程

Python学习笔记__10.2章多线程