深入理解Python中的ThreadLocal变量(下)

上篇我们看到了 ThreadLocal 变量的简单使用,中篇对python中 ThreadLocal 的实现进行了分析,但故事还没有结束。本篇我们一起来看下Werkzeug中ThreadLocal的设计。

Werkzeug 作为一个 WSGI
工具库,由于一些方面的考虑,并没有直接使用python内置的ThreadLocal类,而是自己实现了一系列Local类。包括简单的Local,以及在此基础上实现的LocalStack,LocalManager
和 LocalProxy。接下来我们一起来看看这些类的使用方式,设计的初衷,以及具体的实现技巧。

Local 类的设计

Werkzeug 的设计者认为python自带的ThreadLocal并不能满足需求,主要因为下面两个原因:

  • Werkzeug 主要用“ThreadLocal”来满足并发的要求,python 自带的ThreadLocal只能实现基于线程的并发。而python中还有其他许多并发方式,比如常见的协程(greenlet),因此需要实现一种能够支持协程的Local对象。
  • WSGI不保证每次都会产生一个新的线程来处理请求,也就是说线程是可以复用的(可以维护一个线程池来处理请求)。这样如果werkzeug
    使用python自带的ThreadLocal,一个“不干净(存有之前处理过的请求的相关数据)”的线程会被用来处理新的请求。

为了解决这两个问题,werkzeug 中实现了Local类。Local对象可以做到线程和协程之间数据的隔离,此外,还要支持清理某个线程或者协程下的数据(这样就可以在处理一个请求之后,清理相应的数据,然后等待下一个请求的到来)。

具体怎么实现的呢,思想其实特别简单,我们在深入理解Python中的ThreadLocal变量(上) 一文的最后有提起过,就是创建一个全局字典,然后将线程(或者协程)标识符作为key,相应线程(或协程)的局部数据作为 value。这里 werkzeug 就是按照上面思路进行实现,不过利用了python的一些黑魔法,最后提供给用户一个清晰、简单的接口。

具体实现

Local 类的实现在 werkzeug.local 中,以 8a84b62 版本的代码进行分析。通过前两篇对ThreadLocal的了解,我们已经知道了Local对象的特点和使用方法。所以这里不再给出Local对象的使用例子,我们直接看代码。


  1. class Local(object): 
  2.     __slots__ = ('__storage__', '__ident_func__') 
  3.      
  4.     def __init__(self): 
  5.         object.__setattr__(self, '__storage__', {}) 
  6.         object.__setattr__(self, '__ident_func__', get_ident) 
  7.     ...  

由于可能有大量的Local对象,为了节省Local对象占用的空间,这里使用 __slots__ 写死了Local可以拥有的属性:

  1. __storage__: 值为一个字典,用来保存实际的数据,初始化为空;
  2. __ident_func__:值为一个函数,用来找到当前线程或者协程的标志符。

由于Local对象实际的数据保存在__storage__中,所以对Local属性的操作其实是对__storage__的操作。对于获取属性而言,这里用魔术方法__getattr__拦截__storage__

__ident_func__以外的属性获取,将其导向__storage__存储的当前线程或协程的数据。而对于属性值的set或者del,则分别用__setattr__和__setattr__来实现(这些魔术方法的介绍见属性控制)。关键代码如下所示:


  1. def __getattr__(self, name): 
  2.     try: 
  3.         return self.__storage__[self.__ident_func__()][name] 
  4.     except KeyError: 
  5.         raise AttributeError(name) 
  6.  
  7. def __setattr__(self, name, value): 
  8.     ident = self.__ident_func__() 
  9.     storage = self.__storage__ 
  10.     try: 
  11.         storage[ident][name] = value 
  12.     except KeyError: 
  13.         storage[ident] = {name: value} 
  14.  
  15. def __delattr__(self, name): 
  16.     try: 
  17.         del self.__storage__[self.__ident_func__()][name] 
  18.     except KeyError: 
  19.         raise AttributeError(name)  

假设我们有ID为1,2, ... , N 的N个线程或者协程,每个都用Local对象保存有自己的一些局部数据,那么Local对象的内容如下图所示:

此外,Local类还提供了__release_local__方法,用来释放当前线程或者协程保存的数据。

Local 扩展接口

Werkzeug 在 Local 的基础上实现了 LocalStack 和 LocalManager,用来提供更加友好的接口支持。

LocalStack

LocalStack通过封装Local从而实现了一个线程(或者协程)独立的栈结构,注释里面有具体的使用方法,一个简单的使用例子如下:


  1. ls = LocalStack() 
  2. ls.push(12) 
  3. print ls.top    # 12 
  4. print ls._local.__storage__ 
  5. # {140735190843392: {'stack': [12]}}  

LocalStack 的实现比较有意思,它将一个Local对象作为自己的属性_local,然后定义接口push, pop 和 top
方法进行相应的栈操作。这里用 _local.__storage__._local.__ident_func__()
这个list来模拟栈结构。在接口push,
pop和top中,通过操作这个list来模拟栈的操作,需要注意的是在接口函数内部获取这个list时,不用像上面黑体那么复杂,可以直接用_local的getattr()方法即可。以
push 函数为例,实现如下:


  1. def push(self, obj): 
  2.     """Pushes a new item to the stack""" 
  3.     rv = getattr(self._local, 'stack', None) 
  4.     if rv is None: 
  5.         self._local.stack = rv = [] 
  6.     rv.append(obj) 
  7.     return rv  

pop 和 top 的实现和一般栈类似,都是对 stack = getattr(self._local, 'stack', None)
这个列表进行相应的操作。此外,LocalStack还允许我们自定义__ident_func__,这里用 内置函数 property
生成了描述器,封装了__ident_func__的get和set操作,提供了一个属性值__ident_func__作为接口,具体代码如下:


  1. def _get__ident_func__(self): 
  2.     return self._local.__ident_func__ 
  3.  
  4. def _set__ident_func__(self, value): 
  5.     object.__setattr__(self._local, '__ident_func__', value) 
  6. __ident_func__ = property(_get__ident_func__, _set__ident_func__) 
  7. del _get__ident_func__, _set__ident_func__  

LocalManager

Local 和 LocalStack 都是线程或者协程独立的单个对象,很多时候我们需要一个线程或者协程独立的容器,来组织多个Local或者LocalStack对象(就像我们用一个list来组织多个int或者string类型一样)。

Werkzeug实现了LocalManager,它通过一个list类型的属性locals来存储所管理的Local或者LocalStack对象,还提供cleanup方法来释放所有的Local对象。Werkzeug中LocalManager最主要的接口就是装饰器方法make_middleware,代码如下:


  1. def make_middleware(self, app): 
  2.     """Wrap a WSGI application so that cleaning up happens after 
  3.     request end. 
  4.     """ 
  5.     def application(environ, start_response): 
  6.         return ClosingIterator(app(environ, start_response), self.cleanup) 
  7.     return application  

这个装饰器注册了回调函数cleanup,当一个线程(或者协程)处理完请求之后,就会调用cleanup清理它所管理的Local或者LocalStack
对象(ClosingIterator 的实现在 werkzeug.wsgi中)。下面是一个使用 LocalManager 的简单例子:


  1. from werkzeug.local import Local, LocalManager 
  2.  
  3. local = Local() 
  4. local_2 = Local() 
  5. local_manager = LocalManager([local, local2]) 
  6.  
  7. def application(environ, start_response): 
  8.     local.request = request = Request(environ) 
  9.     ... 
  10.  
  11. # application 处理完毕后,会自动清理local_manager 的内容 
  12. application = local_manager.make_middleware(application)  

通过LocalManager的make_middleware我们可以在某个线程(协程)处理完一个请求后,清空所有的Local或者LocalStack对象,这样这个线程又可以处理另一个请求了。至此,文章开始时提到的第二个问题就可以解决了。Werkzeug.local
里面还实现了一个 LocalProxy 用来作为Local对象的代理,也非常值得去学习。

通过这三篇文章,相信对 ThreadLocal
有了一个初步的了解。Python标准库和Werkzeug在实现中都用到了很多python的黑魔法,不过最终提供给用户的都是非常友好的接口。Werkzeug作为WSGI

工具集,为了解决Web开发中的特定使用问题,提供了一个改进版本,并且进行了一系列封装,便于使用。不得不说,werkzeug的代码可读性非常好,注释也是写的非常棒,建议去阅读源码。

作者:selfboot

来源:51CTO

时间: 2024-12-28 16:16:40

深入理解Python中的ThreadLocal变量(下)的相关文章

深入理解Python中的ThreadLocal变量(中)

在 深入理解Python中的ThreadLocal变量(上)中我们看到 ThreadLocal 的引入,使得可以很方便地在多线程环境中使用局部变量.如此美妙的功能到底是怎样实现的?如果你对它的实现原理没有好奇心或一探究竟的冲动,那么接下来的内容估计会让你后悔自己的浅尝辄止了. 简单来说,Python 中 ThreadLocal 就是通过下图中的方法,将全局变量伪装成线程局部变量,相信读完本篇文章你会理解图中内容的.(对这张图不眼熟的话,可以回顾下上篇)). 在哪里找到源码? 好了,终于要来分析

深入理解Python中的ThreadLocal变量(上)

我们知道多线程环境下,每一个线程均可以使用所属进程的全局变量.如果一个线程对全局变量进行了修改,将会影响到其他所有的线程.为了避免多个线程同时对变量进行修改,引入了线程同步机制,通过互斥锁,条件变量或者读写锁来控制对全局变量的访问. 只用全局变量并不能满足多线程环境的需求,很多时候线程还需要拥有自己的私有数据,这些数据对于其他线程来说不可见.因此线程中也可以使用局部变量,局部变量只有线程自身可以访问,同一个进程下的其他线程不可访问. 有时候使用局部变量不太方便,因此 python 还提供了 Th

理解Python中的装饰器

文章先由stackoverflow上面的一个问题引起吧,如果使用如下的代码: @makebold @makeitalic def say(): return "Hello" 打印出如下的输出: <b><i>Hello<i></b> 你会怎么做?最后给出的答案是: def makebold(fn): def wrapped(): return "<b>" + fn() + "</b>&q

理解java中的ThreadLocal 专题

ThreadLocal每一印象: public class IncrementWithStaticVariable{ private static int seqNum = 0; public int getNextNum(){ seqNum ++; return seqNum; } public static void main(String[] args) { IncrementWithStaticVariablesn = new IncrementWithStaticVariable();

进一步理解Python中的函数编程_python

我们最好从最难的问题开始:"到底什么是函数编程 (FP)?"一个答案可能会说 FP 就是您在使用例如 Lisp.Scheme.Haskell.ML.OCAML.Clean.Mercury.Erlang(或其它一些)语言进行编程时所做的.这是一个稳妥的答案,但不能很确切地阐明问题.不幸的是,即使是函数程序员他们自己也很难对 FP 究竟是什么有个一致的认识."盲人摸象"的故事用来形容这一情况似乎很合适.还可以放心地将 FP 与"命令编程"(使用例如

深入理解Python中的元类(metaclass)_python

译注:这是一篇在Stack overflow上很热的帖子.提问者自称已经掌握了有关Python OOP编程中的各种概念,但始终觉得元类(metaclass)难以理解.他知道这肯定和自省有关,但仍然觉得不太明白,希望大家可以给出一些实际的例子和代码片段以帮助理解,以及在什么情况下需要进行元编程.于是e-satis同学给出了神一般的回复,该回复获得了985点的赞同点数,更有人评论说这段回复应该加入到Python的官方文档中去.而e-satis同学本人在Stack Overflow中的声望积分也高达6

深入Python解释器理解Python中的字节码_python

我最近在参与Python字节码相关的工作,想与大家分享一些这方面的经验.更准确的说,我正在参与2.6到2.7版本的CPython解释器字节码的工作. Python是一门动态语言,在命令行工具下运行时,本质上执行了下面的步骤:     当第一次执行到一段代码时,这段代码会被编译(如,作为一个模块加载,或者直接执行).根据操作系统的不同,这一步生成后缀名是pyc或者pyo的二进制文件.     解释器读取二进制文件,并依次执行指令(opcodes). Python解释器是基于栈的.要理解数据流向,我

深入理解Python中的__builtin__和__builtins__

0.说明         这里的说明主要是以Python 2.7为例,因为在Python 3+中,__builtin__模块被命名为builtins,下面主要是探讨Python 2.x中__builtin__模块和__builtins__模块的区别和联系. 1.名称空间(Namespace)         首先不得不说名称空间,因为名称空间是Python中非常重要的一个概念,所谓名称空间,其实指的是名称(标识符)到对象的映射.         在一个正常的Python程序的执行过程中,至少存在

理解Python中函数的参数_python

 定义函数的时候,我们把参数的名字和位置确定下来,函数的接口定义就完成了.对于函数的调用者来说,只需要知道如何传递正确的参数,以及函数将返回什么样的值就够了,函数内部的复杂逻辑被封装起来,调用者无需了解. Python的函数定义非常简单,但灵活度却非常大.除了正常定义的必选参数外,还可以使用默认参数.可变参数和关键字参数,使得函数定义出来的接口,不但能处理复杂的参数,还可以简化调用者的代码.默认参数 我们仍以具体的例子来说明如何定义函数的默认参数.先写一个计算x2的函数: def power(x