快乐的老鼠 发表于 2018-8-10 08:29:24

Python学习笔记__10.2章 多线程

  # 这是学习廖雪峰老师python教程的学习笔记
  1、概览
  多任务可以由多进程完成,也可以由一个进程内的多线程完成。进程是由若干线程组成的,一个进程至少有一个线程。
  由于线程是操作系统直接支持的执行单元,因此,高级语言通常都内置多线程的支持,Python也不例外,并且,Python的线程是真正的Posix Thread,而不是模拟出来的线程。
  Python的标准库提供了两个模块:_thread和threading。_thread是低级模块。threading是高级模块,对_thread进行了封装。绝大多数情况下,我们只需要使用threading这个高级模块。
  1.1、创建一个线程
  启动一个线程就是把一个函数传入并创建Thread实例,然后调用start()开始执行:
  import time, threading
  # 新线程执行的代码:
  def loop():
  print('thread %s is running...' % threading.current_thread().name) #打印当前线程实例,此函数体内,都为LoopThread
  n = 0
  while n < 5:
  n = n + 1
  print('thread %s >>> %s' % (threading.current_thread().name, n))
  time.sleep(1)
  print('thread %s ended.' % threading.current_thread().name)
  print('thread %s is running...' % threading.current_thread().name) #打印当前线程实例,此处为MainThread
  t = threading.Thread(target=loop, name='LoopThread') # 线程执行loop()函数,线程名为‘LoopThread’
  t.start() #启动线程
  t.join()#等待线程运行完毕
  print('thread %s ended.' % threading.current_thread().name)
  threading模块的current_thread()函数,它永远返回当前线程的实例。主线程实例的名字叫MainThread,子线程的名字在创建时指定。如果不指定Python就自动给线程命名为Thread-1,Thread-2……
  2、Lock
  多线程和多进程最大的不同在于,多进程中,同一个变量,各自有一份拷贝存在于每个进程中,互不影响,而多线程中,所有变量都由所有线程共享,所以,任何一个变量都可以被任何一个线程修改,因此,线程之间共享数据最大的危险在于多个线程同时改一个变量,把内容给改乱了。
  2.1、 更改全局变量balance
  import time, threading
  balance = 0
  lock = threading.Lock() # threading.Lock(),创建一个锁
  def change_it(n):
  # 先加后减,结果应该为0:
  global balance
  balance = balance + n
  balance = balance - n
  def run_thread(n):
  for i in range(100000):
  # 先要获取锁:
  lock.acquire()
  try:
  # 进行修改:
  change_it(n)
  finally:
  # 改完了一定要释放锁:
  lock.release()
  t1 = threading.Thread(target=run_thread, args=(5,))#创建线程,让t1指向这个线程
  t2 = threading.Thread(target=run_thread, args=(8,))#创建线程,让t2指向这个线程
  t1.start()
  t2.start()
  t1.join()
  t2.join()
  print(balance)
  当多个线程同时执行lock.acquire()时,只有一个线程能成功地获取锁,然后继续执行代码,其他线程就继续等待直到获得锁为止
  锁的好处:

[*]  是确保了某段关键代码只能由一个线程从头到尾完整地执行
  锁的坏处:

[*]  阻止了多线程并发执行,包含锁的某段代码实际上只能以单线程模式执行,效率就大大地下降了。
[*]  由于可以存在多个锁,不同的线程持有不同的锁,并试图获取对方持有的锁时,可能会造成死锁,导致多个线程全部挂起,既不能执行,也无法结束,只能靠操作系统强制终止。
  3、多核CPU
  3.1、 死循环测试CPU 使用率
  import threading, multiprocessing
  def loop():# 死循环
  x = 0
  while True:
  x = x ^ 1
  for i in range(multiprocessing.cpu_count()): # multiprocessing.cpu_count()=cpu 逻辑核数量
  t = threading.Thread(target=loop)
  t.start()
  启动与CPU核心数量相同的N个线程,在4核CPU上可以监控到CPU占用率仅有102%,也就是仅使用了一核。
  用C、C++或Java来改写相同的死循环,直接可以把全部核心跑满。但Python不行
  因为Python的线程虽然是真正的线程,但解释器执行代码时,有一个GIL锁:Global Interpreter Lock,任何Python线程执行前,必须先获得GIL锁,然后,每执行100条字节码,解释器就自动释放GIL锁,让别的线程有机会执行。这个GIL全局锁实际上把所有线程的执行代码都给上了锁,所以,多线程在Python中只能交替执行,即使100个线程跑在100核CPU上,也只能用到1个核
  Python虽然不能利用多线程实现多核任务,但可以通过多进程实现多核任务。多个Python进程有各自独立的GIL锁,互不影响。
  4、小结
  多线程编程,模型复杂,容易发生冲突,必须用锁加以隔离,同时,又要小心死锁的发生。
  Python解释器由于设计时有GIL全局锁,导致了多线程无法利用多核。多线程的并发在Python中就是一个美丽的梦。
页: [1]
查看完整版本: Python学习笔记__10.2章 多线程