记录遇到的Python陷阱和注意点

来源:http://www.cnblogs.com/wilber2013/p/5178620.html

最近使用Python的过程中遇到了一些坑,例如用datetime.datetime.now()这个可变对象作为函数的默认参数,模块循环依赖等等。

在此记录一下,方便以后查询和补充。

避免可变对象作为默认参数

在使用函数的过程中,经常会涉及默认参数。在Python中,当使用可变对象作为默认参数的时候,就可能产生非预期的结果。

下面看一个例子:

def append_item(a = 1, b = []):
    b.append(a)
    print b

append_item(a=1)
append_item(a=3)
append_item(a=5)  

结果为:

[1]
[1, 3]
[1, 3, 5]

从结果中可以看到,当后面两次调用append_item函数的时候,函数参数b并没有被初始化为[],而是保持了前面函数调用的值。

之所以得到这个结果,是因为在Python中,一个函数参数的默认值,仅仅在该函数定义的时候,被初始化一次

下面看一个例子证明Python的这个特性:

class Test(object):
    def __init__(self):
        print("Init Test")  

def arg_init(a, b = Test()):
    print(a)  

arg_init(1)
arg_init(3)
arg_init(5)

结果为:

Init Test
1
3
5

从这个例子的结果就可以看到,Test类仅仅被实例化了一次,也就是说默认参数跟函数调用次数无关,仅仅在函数定义的时候被初始化一次。

可变默认参数的正确使用

对于可变的默认参数,我们可以使用下面的模式来避免上面的非预期结果:

def append_item(a = 1, b = None):
    if b is None:
        b = []
    b.append(a)
    print b

append_item(a=1)
append_item(a=3)
append_item(a=5) 

结果为:

[1]
[3]
[5]

Python中的作用域

Python的作用域解析顺序为Local、Enclosing、Global、Built-in,也就是说Python解释器会根据这个顺序解析变量。

看一个简单的例子:

global_var = 0

def outer_func():
    outer_var = 1

    def inner_func():
        inner_var = 2

        print "global_var is :", global_var
        print "outer_var is :", outer_var
        print "inner_var is :", inner_var

    inner_func()

outer_func()

结果为:

global_var is : 0
outer_var is : 1
inner_var is : 2

在Python中,关于作用域有一点需要注意的是,在一个作用域里面给一个变量赋值的时候,Python会认为这个变量是当前作用域的本地变量

对于这一点也是比较容易理解的,对于下面代码var_func中给num变量进行了赋值,所以此处的num就是var_func作用域的本地变量。

num = 0

def var_func():
    num = 1
    print "num is :", num

var_func()

问题一

但是,当我们通过下面的方式使用变量的时候,就会产生问题了:

num = 0

def var_func():
    print "num is :", num
    num = 1

var_func()

结果如下,之所以产生这个错误,就是因为我们在var_func中给num变量进行了赋值,所以Python解释器会认为numvar_func作用域的本地变量,但是当代码执行到print "num is :", num语句的时候,num还是未定义。

UnboundLocalError: local variable 'num' referenced before assignment

问题二

上面的错误还是比较明显的,还有一种比较隐蔽的错误形式如下:

li = [1, 2, 3]

def foo():
    li.append(4)
    print li

foo()

def bar():
    li +=[5]
    print li

bar()

代码的结果为:

[1, 2, 3, 4]
UnboundLocalError: local variable 'li' referenced before assignment

foo函数中,根据Python的作用域解析顺序,该函数中使用了全局的li变量;但是在bar函数中,对li变量进行了赋值,所以li会被当作bar作用域中的变量。

对于bar函数的这个问题,可以通过global关键字。

li = [1, 2, 3]

def foo():
    li.append(4)
    print li

foo()

def bar():
    global li
    li +=[5]
    print li

bar()

类属性隐藏

在Python中,有类属性和实例属性。类属性是属于类本身的,被所有的类实例共享。

类属性可以通过类名访问和修改,也可以通过类实例进行访问和修改。但是,当实例定义了跟类同名的属性后,类属性就被隐藏了。

看下面这个例子:

class Student(object):
    books = ["Python", "JavaScript", "CSS"]
    def __init__(self, name, age):
        self.name = name
        self.age = age
    pass

wilber = Student("Wilber", 27)
print "%s is %d years old" %(wilber.name, wilber.age)

print Student.books
print wilber.books

wilber.books = ["HTML", "AngularJS"]

print Student.books
print wilber.books

del wilber.books

print Student.books
print wilber.books

代码的结果如下,起初wilber实例可以直接访问类的books属性,但是当实例wilber定义了名称为books的实例属性之后,wilber实例的books属性就“隐藏”了类的books属性;当删除了wilber实例的books属性之后,wilber.books就又对应类的books属性了。

Wilber is 27 years old
['Python', 'JavaScript', 'CSS']
['Python', 'JavaScript', 'CSS']
['Python', 'JavaScript', 'CSS']
['HTML', 'AngularJS']
['Python', 'JavaScript', 'CSS']
['Python', 'JavaScript', 'CSS']

当在Python值使用继承的时候,也要注意类属性的隐藏。对于一个类,可以通过类的__dict__属性来查看所有的类属性。

当通过类名来访问一个类属性的时候,会首先查找类的__dict__属性,如果没有找到类属性,就会继续查找父类。但是,如果子类定义了跟父类同名的类属性后,子类的类属性就会隐藏父类的类属性。

看一个例子:

class A(object):
    count = 1
class B(A):
    pass
class C(A):
    pass
print A.count, B.count, C.count
B.count = 2
print A.count, B.count, C.count
A.count = 3
print A.count, B.count, C.count
print B.__dict__
print C.__dict__

结果如下,当类B定义了count这个类属性之后,就会隐藏父类的count属性:

1 1 1
1 2 1
3 2 3
{'count': 2, '__module__': '__main__', '__doc__': None}
{'__module__': '__main__', '__doc__': None}

一般来说,在Python中,类实例属性的访问规则算是比较直观的。

      但是,仍然存在一些不是很直观的地方,特别是对C++和Java程序员来说,更是如此。

      在这里,我们需要明白以下几个地方:

      1.Python是一门动态语言,任何实体都可以动态地添加或删除属性。

      2.一个类定义了一个作用域。

      3.类实例也引入了一个作用域,这与相应类定义的作用域不同。

      4.在类实例中查找属性的时候,首先在实例自己的作用域中查找,如果没有找到,则再在类定义的作用域中查找。

      5.在对类实例属性进行赋值的时候,实际上会在类实例定义的作用域中添加一个属性(如果还不存在的话),并不会影响到相应类中定义的同名属性。

      下面看一个例子,加深对上述几点的理解:

class A:
      cls_i = 0
      cls_j = {}
      def __init__(self):
            self.instance_i = 0
            self.instance_j = {}

在这里,我们先定义类A的一个实例a,然后再看看类A的作用域和实例a的作用域中分别有什么:

>>> a = A()
>>> a.__dict__
{'instance_j': {}, 'instance_i': 0}
>>> A.__dict__
{'__init__': , '__module__': '__main__', 'cls_i': 0, 'cls_j': {}, '__doc__': None}

我们看到,a的作用域中有instance_i和instance_j,A的作用域中有cls_i和cls_j。

      我们再来看看名字查找是如何发生的:

>>> a.cls_i
0
>>> a.instance_i
0
在查找cls_i的时候,实例a的作用域中是没有它的,却在A的作用域中找到了它;在查找instance_i的时候,直接可在a的作用域中找到它。

      如果我们企图通过实例a来修改cls_i的值,那会怎样呢:
>>> a.cls_i = 1
>>> a.__dict__
{'instance_j': {}, 'cls_i': 1, 'instance_i': 0}
>>> A.__dict__
{'__init__': , '__module__': '__main__', 'cls_i': 0, 'cls_j': {}, '__doc__': None}

我们可以看到,a的作用域中多了一个cls_i属性,其值为1;同时,我们也注意到A作用域中的cls_i属性的值仍然为0;在这里,我们其实是增加了一个实例属性,并没有修改到类属性。

       如果我们通过实例a操纵cls_j中的数据(注意不是cls_j本身),又会怎么样呢:

>>> a.cls_j['a'] = 'a'
>>> a.__dict__
{'instance_j': {}, 'cls_i': 1, 'instance_i': 0}
>>> A.__dict__
{'__init__': , '__module__': '__main__', 'cls_i': 0, 'cls_j': {'a': 'a'}, '__doc__': None}

我们可以看到a的作用域没有发生什么变化,但是A的作用域发生了一些变化,cls_j中的数据发生了变化。

      实例的作用域发生变化,并不会影响到该类的其它实例,但是类的作用域发生变化,则会影响到该类的所有实例,包括在这之前创建的实例:

>>> A.cls_k = 0
>>> i.cls_k
0

http://www.cnblogs.com/frydsh/p/3194710.html

tuple是“可变的”

在Python中,tuple是不可变对象,但是这里的不可变指的是tuple这个容器总的元素不可变(确切的说是元素的id),但是元素的值是可以改变的。

tpl = (1, 2, 3, [4, 5, 6])
print id(tpl)
print id(tpl[3])
tpl[3].extend([7, 8])
print tpl
print id(tpl)
print id(tpl[3])

代码结果如下,对于tpl对象,它的每个元素都是不可变的,但是tpl[3]是一个list对象。也就是说,对于这个tpl对象,id(tpl[3])是不可变的,但是tpl[3]确是可变的。

36764576
38639896
(1, 2, 3, [4, 5, 6, 7, 8])
36764576
38639896

Python的深浅拷贝

在对Python对象进行赋值的操作中,一定要注意对象的深浅拷贝,一不小心就可能踩坑了。

当使用下面的操作的时候,会产生浅拷贝的效果:

  • 使用切片[:]操作
  • 使用工厂函数(如list/dir/set)
  • 使用copy模块中的copy()函数

使用copy模块里面的浅拷贝函数copy():

import copy

will = ["Will", 28, ["Python", "C#", "JavaScript"]]
wilber = copy.copy(will)

print id(will)
print will
print [id(ele) for ele in will]
print id(wilber)
print wilber
print [id(ele) for ele in wilber]

will[0] = "Wilber"
will[2].append("CSS")
print id(will)
print will
print [id(ele) for ele in will]
print id(wilber)
print wilber
print [id(ele) for ele in wilber]

使用copy模块里面的深拷贝函数deepcopy():

import copy

will = ["Will", 28, ["Python", "C#", "JavaScript"]]
wilber = copy.deepcopy(will)

print id(will)
print will
print [id(ele) for ele in will]
print id(wilber)
print wilber
print [id(ele) for ele in wilber]

will[0] = "Wilber"
will[2].append("CSS")
print id(will)
print will
print [id(ele) for ele in will]
print id(wilber)
print wilber
print [id(ele) for ele in wilber]

模块循环依赖

在Python中使用import导入模块的时候,有的时候会产生模块循环依赖,例如下面的例子,module_x模块和module_y模块相互依赖,运行module_y.py的时候就会产生错误。

# module_x.py
import module_y

def inc_count():
    module_y.count += 1
    print module_y.count

# module_y.py
import module_x

count = 10

def run():
    module_x.inc_count()

run()            

其实,在编码的过程中就应当避免循环依赖的情况,或者代码重构的过程中消除循环依赖。

当然,上面的问题也是可以解决的,常用的解决办法就是把引用关系搞清楚,让某个模块在真正需要的时候再导入(一般放到函数里面)。

对于上面的例子,就可以把module_x.py修改为如下形式,在函数内部导入module_y

# module_x.py
def inc_count():
    import module_y
    module_y.count += 1
    print module_y.count
时间: 2024-08-03 01:34:51

记录遇到的Python陷阱和注意点的相关文章

程序员老司机们都要错的Python陷阱与缺陷列表

我个人对陷阱的定义是这样的:代码看起来可以工作,但不是以你"想当然""的方式.如果一段代码直接出错,抛出了异常,我不认为这是陷阱.比如,Python程序员应该都遇到过的"UnboundLocalError", 示例: >>> a=1  >>> def func():  ...     a+=1  ...     print a  ...  >>> func()  Traceback (most rece

程序员必知的Python陷阱与缺陷列表

我个人对陷阱的定义是这样的:代码看起来可以工作,但不是以你"想当然""的方式.如果一段代码直接出错,抛出了异常,我不认为这是陷阱.比如,Python程序员应该都遇到过的"UnboundLocalError", 示例: >>> a=1    >>> def func():    ...     a+=1    ...     print a    ...    >>> func()    Tracebac

【Python】获取主机ip的方式

最近写后台业务逻辑,要用到获取本机ip地址的方法,记录两个python的实现方式: import socket import struct import fcntl import commands def getLocalIP(): status,output=commands.getstatusoutput("hostname -i") if status : return '127.0.0.1' else : return output def getip(ethname): s=

Python中的pprint折腾记_python

1.背景 看到这里提到了pprint.  打算去试试. 2.pprint简介 找到在线官网解释: pprint - Data pretty printer  就是一个,方便大家打印一些,相对复杂的变量的好东西. 3.使用pprint 去写点代码试试. 代码: 复制代码 代码如下: #------------------------------------------------------------------------------- # Name:        [记录]折腾Python中

python 实现web框架simfish

本文主要记录本人利用python实现web框架simfish的过程.源码github地址:simfish WSGI HTTP Server wsgi模块提供了简单的simple_server, wsgiref.simple_server.make_server(host, port, app, server_class=WSGIServer, handler_class=WSGIRequestHandler) 官方提供的例子, from wsgiref.simple_server import

Python之路【2】:Python基础

入门拾遗 一.作用域 只要变量在内存中就能被调用!但是(函数的栈有点区别) 对于变量的作用域,执行声明并在内存中存在,如果变量在内存中存在就可以被调用. 1 if 1==1: 2 name = 'tianshuai' 3 print name 所以下面的说法是不对的: 外层变量,可以被内层变量使用 内层变量,无法被外层变量使用 二.三元运算 1 result = 值1 if 条件 else 值2 例子: 1 name = raw_input("please input your name: &q

转:VIM python 自动补全插件:pydiction

1.这是一个相当不错的 Python 代码自动完成的脚本. 2. 3.可以实现下面python代码的自动补全: 4. 5.简单python关键词补全 6.python 函数补全带括号 7.python 模块补全 8.python 模块内函数,变量补全 9.from module import sub-module 补全 10.pydiction 插件安装 11. 12.pydiction 1.0 之后版本安装配置 13. 14.适用VIM7之后的版本. 15. 16.1.python_pydic

PYTHON线程知识再研习F---队列同步Queue

让我们考虑更复杂的一种场景:产品是各不相同的.这时只记录一个数量就不够了,还需要记录每个产品的细节.很容易想到需要用一个容器将这些产品记录下来. Python的Queue模块中提供了同步的.线程安全的队列类,包括FIFO(先入先出)队列Queue,LIFO(后入先出)队列 LifoQueue,和优先级队列PriorityQueue.这些队列都实现了锁原语,能够在多线程中直接使用.可以使用队列来实现线程间的同步.   #!/usr/bin/env python # -*- coding: utf-

top n-python sqlalchemy 如何实现top写法。想按日期倒排序获取前10条记录。

问题描述 python sqlalchemy 如何实现top写法.想按日期倒排序获取前10条记录. python sqlalchemy 如何实现top写法.想按日期倒排序获取前10条记录. 解决方案 python懂的不多 这是一些积累的资料 希望对你有用啊http://download.csdn.net/album/detail/1239