用Python多线程实现生产者消费者模式

什么是生产者消费者模式

在软件开发的过程中,经常碰到这样的场景:

某些模块负责生产数据,这些数据由其他模块来负责处理(此处的模块可能是:函数、线程、进程等)。产生数据的模块称为生产者,而处理数据的模块称为消费者。在生产者与消费者之间的缓冲区称之为仓库。生产者负责往仓库运输商品,而消费者负责从仓库里取出商品,这就构成了生产者消费者模式。

结构图如下:

为了大家容易理解,我们举一个寄信的例子。假设你要寄一封信,大致过程如下:

你把信写好——相当于生产者生产数据

你把信放入邮箱——相当于生产者把数据放入缓冲区

邮递员把信从邮箱取出,做相应处理——相当于消费者把数据取出缓冲区,处理数据

生产者消费者模式的优点

  • 解耦

假设生产者和消费者分别是两个线程。如果让生产者直接调用消费者的某个方法,那么生产者对于消费者就会产生依赖(也就是耦合)。如果未来消费者的代码发生变化,可能会影响到生产者的代码。而如果两者都依赖于某个缓冲区,两者之间不直接依赖,耦合也就相应降低了。

举个例子,我们去邮局投递信件,如果不使用邮箱(也就是缓冲区),你必须得把信直接交给邮递员。有同学会说,直接给邮递员不是挺简单的嘛?其实不简单,你必须
得认识谁是邮递员,才能把信给他。这就产生了你和邮递员之间的依赖(相当于生产者和消费者的强耦合)。万一哪天邮递员
换人了,你还要重新认识一下(相当于消费者变化导致修改生产者代码)。而邮箱相对来说比较固定,你依赖它的成本就比较低(相当于和缓冲区之间的弱耦合)。

  • 并发

由于生产者与消费者是两个独立的并发体,他们之间是用缓冲区通信的,生产者只需要往缓冲区里丢数据,就可以继续生产下一个数据,而消费者只需要从缓冲区拿数据即可,这样就不会因为彼此的处理速度而发生阻塞。

继续上面的例子,如果我们不使用邮箱,就得在邮局等邮递员,直到他回来,把信件交给他,这期间我们啥事儿都不能干(也就是生产者阻塞)。或者邮递员得挨家挨户问,谁要寄信(相当于消费者轮询)。

  • 支持忙闲不均

当生产者制造数据快的时候,消费者来不及处理,未处理的数据可以暂时存在缓冲区中,慢慢处理掉。而不至于因为消费者的性能造成数据丢失或影响生产者生产。

我们再拿寄信的例子,假设邮递员一次只能带走1000封信,万一碰上情人节(或是圣诞节)送贺卡,需要寄出去的信超过了1000封,这时候邮箱这个缓冲区就派上用场了。邮递员把来不及带走的信暂存在邮箱中,等下次过来时再拿走。

通过上面的介绍大家应该已经明白了生产者消费者模式。

Python中的多线程编程

在实现生产者消费者模式之前,我们先学习下Python中的多线程编程。

线程是操作系统直接支持的执行单元,高级语言通常都内置多线程的支持,Python也不例外,并且Python的线程是真正的Posix Thread,而不是模拟出来的线程。

Python的标准库提供了两个模块:_thread和threading,_thread是低级模块,threading是高级模块,对_thread进行了封装。绝大多数情况下,我们只需要使用threading这个高级模块。

下面我们先看一段在Python中实现多线程的代码。


  1. import time,threading 
  2.  
  3. #线程代码 
  4.  
  5. class TaskThread(threading.Thread): 
  6.  
  7.     def __init__(self,name): 
  8.  
  9.         threading.Thread.__init__(self,name=name) 
  10.  
  11.     def run(self): 
  12.  
  13.         print('thread %s is running...' % self.getName()) 
  14.  
  15.   
  16.  
  17.         for i in range(6): 
  18.  
  19.             print('thread %s >>> %s' % (self.getName(), i)) 
  20.  
  21.             time.sleep(1) 
  22.  
  23.   
  24.  
  25.         print('thread %s finished.' % self.getName()) 
  26.  
  27.   
  28.  
  29. taskthread = TaskThread('TaskThread') 
  30.  
  31. taskthread.start() 
  32.  
  33. taskthread.join()  

下面是程序的执行结果:


  1. thread TaskThread is running... 
  2.  
  3. thread TaskThread >>> 0 
  4.  
  5. thread TaskThread >>> 1 
  6.  
  7. thread TaskThread >>> 2 
  8.  
  9. thread TaskThread >>> 3 
  10.  
  11. thread TaskThread >>> 4 
  12.  
  13. thread TaskThread >>> 5 
  14.  
  15. thread TaskThread finished.  

TaskThread类继承自threading模块中的Thread线程类。构造函数的name参数指定线程的名字,通过重载基类run函数实现具体任务。

在简单熟悉了Python的线程后,下面我们实现一个生产者消费者模式。


  1. from Queue import Queue 
  2.  
  3. import random,threading,time 
  4.  
  5.   
  6.  
  7. #生产者类 
  8.  
  9. class Producer(threading.Thread): 
  10.  
  11.     def __init__(self, name,queue): 
  12.  
  13.         threading.Thread.__init__(self, name=name) 
  14.  
  15.         self.data=queue 
  16.  
  17.   
  18.  
  19.     def run(self): 
  20.  
  21.         for i in range(5): 
  22.  
  23.             print("%s is producing %d to the queue!" % (self.getName(), i)) 
  24.  
  25.             self.data.put(i) 
  26.  
  27.             time.sleep(random.randrange(10)/5) 
  28.  
  29.         print("%s finished!" % self.getName()) 
  30.  
  31.   
  32.  
  33. #消费者类 
  34.  
  35. class Consumer(threading.Thread): 
  36.  
  37.     def __init__(self,name,queue): 
  38.  
  39.         threading.Thread.__init__(self,name=name) 
  40.  
  41.         self.data=queue 
  42.  
  43.     def run(self): 
  44.  
  45.         for i in range(5): 
  46.  
  47.             val = self.data.get() 
  48.  
  49.             print("%s is consuming. %d in the queue is consumed!" % (self.getName(),val)) 
  50.  
  51.             time.sleep(random.randrange(10)) 
  52.  
  53.         print("%s finished!" % self.getName()) 
  54.  
  55.   
  56.  
  57. def main(): 
  58.  
  59.     queue = Queue() 
  60.  
  61.     producer = Producer('Producer',queue) 
  62.  
  63.     consumer = Consumer('Consumer',queue) 
  64.  
  65.   
  66.  
  67.     producer.start() 
  68.  
  69.     consumer.start() 
  70.  
  71.   
  72.  
  73.     producer.join() 
  74.  
  75.     consumer.join() 
  76.  
  77.     print 'All threads finished!' 
  78.  
  79.   
  80.  
  81. if __name__ == '__main__': 
  82.  
  83.     main()  

执行结果可能如下:


  1. Producer is producing 0 to the queue! 
  2.  
  3. Consumer is consuming. 0 in the queue is consumed! 
  4.  
  5. Producer is producing 1 to the queue! 
  6.  
  7. Producer is producing 2 to the queue! 
  8.  
  9. Consumer is consuming. 1 in the queue is consumed! 
  10.  
  11. Consumer is consuming. 2 in the queue is consumed! 
  12.  
  13. Producer is producing 3 to the queue! 
  14.  
  15. Producer is producing 4 to the queue! 
  16.  
  17. Producer finished! 
  18.  
  19. Consumer is consuming. 3 in the queue is consumed! 
  20.  
  21. Consumer is consuming. 4 in the queue is consumed! 
  22.  
  23. Consumer finished! 
  24.  
  25. All threads finished!  

因为多线程是抢占式执行的,所以打印出的运行结果不一定和上面的完全一致。

小结

本例通过Python实现了一个简单的生产者消费者模型。Python中的Queue模块已经提供了对线程同步的支持,所以本文并没有涉及锁、同步、死锁等多线程问题。

作者:佚名

来源:51CTO

时间: 2024-08-02 23:47:49

用Python多线程实现生产者消费者模式的相关文章

python 多线程笔记(6)-- 生产者/消费者模式(续)

  用 threading.Event() 也可以实现生产者/消费者模式 (自己拍脑袋想出来的,无法知道其正确性,请大神告知为谢!)   import threading import time import random products = 20 class Producer(threading.Thread): '''生产者''' ix = [0] # 生产者实例个数 # 闭包,必须是数组,不能直接 ix = 0 def __init__(self): super().__init__()

聊聊并发:生产者消费者模式

在并发编程中使用生产者和消费者模式能够解决绝大多数并发问题.该模式通过平衡生产线程和消费线程的工作能力来提高程序的整体处理数据的速度. 为什么要使用生产者和消费者模式 在线程世界里,生产者就是生产数据的线程,消费者就是消费数据的线程.在多线程开发当中,如果生产者处理速度很快,而消费者处理速度很慢,那么生产者就必须等待消费者处理完,才能继续生产数据.同样的道理,如果消费者的处理能力大于生产者,那么消费者就必须等待生产者.为了解决这个问题于是引入了生产者和消费者模式. 什么是生产者消费者模式 生产者

[Java] 多线程下生产者消费者问题的五种同步方法实现

版权声明:请尊重个人劳动成果,转载注明出处,谢谢! 目录(?)[+] 生产者消费者模式是通过一个容器来解决生产者和消费者的强耦合问题.    生产者消费者模式的优点 - 解耦 - 支持并发 - 支持忙闲不均 解决方法可分为两类:   (1)用信号量和锁机制实现生产者和消费者之间的同步:    - wait() / notify()方法  - await() / signal()方法  - BlockingQueue阻塞队列方法  - Semaphore方法    (2)在生产者和消费者之间建立一

聊聊并发(十)生产者消费者模式

本文首发于InfoQ   作者:方腾飞  校对:张龙 在并发编程中使用生产者和消费者模式能够解决绝大多数并发问题.该模式通过平衡生产线程和消费线程的工作能力来提高程序的整体处理数据的速度. 为什么要使用生产者和消费者模式 在线程世界里,生产者就是生产数据的线程,消费者就是消费数据的线程.在多线程开发当中,如果生产者处理速度很快,而消费者处理速度很慢,那么生产者就必须等待消费者处理完,才能继续生产数据.同样的道理,如果消费者的处理能力大于生产者,那么消费者就必须等待生产者.为了解决这种生产消费能力

Qt之线程同步(生产者消费者模式 - QWaitCondition)

简述 生产者将数据写入缓冲区,直到它到达缓冲区的末尾,这时,它从开始位置重新启动,覆盖现有数据.消费者线程读取数据并将其写入标准错误. Wait condition(等待条件)比单独使用 mutex(互斥量)有一个更高级的并发性,如果缓冲区的访问由一个 QMutex 把守,当生产者线程访问缓冲区时,消费者线程将无法访问.然而,两个线程同时访问不同的缓冲区是没有害处的. 示例包含两个类:Producer 和 Consumer,均继承自 QThread.循环缓冲区用于两个类之间的沟通,同步工具用于保

java多线程解决生产者消费者问题_java

本文实例讲述了java多线程解决生产者消费者问题的方法.分享给大家供大家参考.具体分析如下: 题目是这样的: 采用Java 多线程技术,设计实现一个符合生产者和消费者问题的程序.对一个对象(枪膛)进行操作,其最大容量是12颗子弹.生产者线程是一个压入线程,它不断向枪膛中压入子弹:消费者线程是一个射出线程,它不断从枪膛中射出子弹. 要求: (1)给出分析过程说明. (2)程序输出,要模拟体现对枪膛的压入和射出操作: (2)设计程序时应考虑到两个线程的同步问题. 这个和著名的生产者消费者问题几乎是一

Qt之线程同步(生产者消费者模式 - QSemaphore)

简述 生产者将数据写入缓冲区,直到它到达缓冲区的末尾,此时,它将从开始位置重新启动,覆盖现有数据.消费者线程读取数据并将其写入标准错误. Semaphore(信号量) 比 mutex(互斥量)有一个更高级的并发性.如果缓冲区的访问由一个 QMutex 把守,当生产者线程访问缓冲区时,消费者线程将无法访问.然而,有两个线程同一时间访问不同的缓冲区是没有害处的. 示例包括两个类:Producer 和 Consumer,均继承自 QThread.循环缓冲区用于这两个类之间的沟通,信号量用于保护全局变量

leizi求指教-生产者消费者模式在什么情况下用到?

问题描述 生产者消费者模式在什么情况下用到? 生产者消费者通常都用来解决哪类问题?什么情况下需要想到用到生产者消费者模式呢? 解决方案 一般就是任务队列的时候,比如你有专门处理的任务的线程,同时有生成任务的线程,这样为了好控制,一般是把任务通过队列的方式来传递这样可以有多个线程做生产者,它们只需要把任务不停的丢入队列,同样很多线程做消费者,它们不停的从队列中取任务执行

生产者消费者模式浅析

        原文地址:http://blog.csdn.net/lenyusun/article/details/6609786         由于最近工作中,涉及到生产者消费者设计模式,对此有一些体会,所以总结一下,与大家分享.         什么是生产者消费者模式?         在工作中,大家可能会碰到这样一种情况:某个模块负责产生数据,这些数据由另一个模块来负责处理(此处的模块是广义的,可以是类.函数.线程.进程等).产生数据的模块,就形象地称为生产者:而处理数据的模块,就称为