4.5. localsglobals

Python有两个内置的函数,localsglobals,它们提供了基于字典的访问局部和全局变量的方式。

首先,是关于名字空间的一个名词解释。是枯燥,但是很重要,所以要耐心些。Python使用叫做名字空间的东西来记录变量的轨迹。名字空间只是一个字典,它的键字就是变量名,字典的值就是那些变量的值。实际上,名字空间可以象Python的字典一样进行访问,一会我们就会看到。

在一个Python程序中的任何一个地方,都存在几个可用的名字空间。每个函数都有着自已的名字空间,叫做局部名字空间,它记录了函数的变量,包括函数的参数和局部定义的变量。每个模块拥有它自已的名字空间,叫做全局名字空间,它记录了模块的变量,包括函数、类、其它导入的模块、模块级的变量和常量。还有就是内置名字空间,任何模块均可访问它,它存放着内置的函数和异常。

当一行代码要使用变量 x 的值时,Python会到所有可用的名字空间去查找变量,按照如下顺序:

  1. 局部名字空间 - 特指当前函数或类的方法。如果函数定义了一个局部变量 x,Python将使用这个变量,然后停止搜索。
  2. 全局名字空间 - 特指当前的模块。如果模块定义了一个名为 x 的变量,函数或类,Python将使用这个变量然后停止搜索。
  3. 内置名字空间 - 对每个模块都是全局的。作为最后的尝试,Python将假设 x 是内置函数或变量。

如果Python在这些名字空间找不到 x,它将放弃查找并引发一个 NameError 的异常,同时传 递 There is no variable named 'x' 这样一条信息,回到第一章,你会看到一路上都有这样的信息。但是你并没有体会到Python在给出这样的错误之前做了多少的努力。

Important
Python 2.2将引入一种略有不同但重要的改变,它会影响名字空间的搜索顺序:嵌套的作用域。在Python 2.0中,当你在一个嵌套函数lambda 函数中引用一个变量时,Python会在当前(嵌套的或 lambda)函数的名字空间中搜索,然后在模块的名字空间。Python 2.2将支在当前(嵌套的或 lambda)函数的名字空间中搜索,然后是在父函数的名字空间,接着是模块的名字空间。Python 2.1可以 两种方式工作,缺省地,按Python 2.0的方式工作。但是你可以把下面一行代码增加到你的模块头部,使你的模块工作起来象Python 2.2的方式:
from __future__ import nested_scopes

象Python中的许多事情一样,名字空间在运行时直接可以访问。特别地,局部名字空间可以通过内置的 locals 函数来访问。全局(模块级别)名字空间可以通过 globals 函数来访问。

例 4.10. locals 介绍

>>> def foo(arg): 1
...     x = 1
...     print locals()
...     
>>> foo(7)        2
{'arg': 7, 'x': 1}
>>> foo('bar')    3
{'arg': 'bar', 'x': 1}
1 函数 foo 在它的局部名字空间中有两个变量:arg(它的值被传入函数),和 x(它是在函数里定义的)。
2 locals 返回一个名字/值对的字典。这个字典的键字是字符串形式的变量名字,字典的值是变量的实际值。所以用 7 来调用 foo,会打印出包含函数两个局部变量的字典:arg (7) 和 x (1)。
3 回想一下,Python有动态数据类型,所以你可以非常容易地传递给 arg 一个字符串,这个函数(和对 locals 的调用)将仍然很好的工作。locals 可以用于所有类型的变量。

locals 对局部(函数)名字空间做了些什么,globals 就对全局(模块)名字空间做了什么。然而 globals 更令人兴奋,因为一个模块的名字空间是更令人兴奋的。[9] 不仅仅是模块的名字空间包含了模块级的变量和常量,它还包括了所有在模块中定义的函数和类。再加上,它包括了任何被导入到模块中的东西。

回想一下from module importimport module之间的不同。使用 import module,模块自身被导入,但是它保持着自已的名字空间,这就是为什么你需要使用模块名来访问它的函数或属性(module.function)的原因。但是使用 from module import,实际上是从另一个模块中将指定的函数和属性导入到你自己的名字空间,这就是为什么你可以直接访问它们却不需要引用它们所来源的模块的原因。使用 globals 函数,你会真切地看到这一切的发生。

例 4.11. globals 介绍

把下面的代码加到 BaseHTMLProcessor.py 中:

if __name__ == "__main__":
    for k, v in globals().items():             1
        print k, "=", v
1 不要被吓坏了,想想以前你已经全部都看到过了。globals 函数返回一个字典,我们使用 items 方法和多变量赋值遍历字典。在这里唯一的新东西就是 globals 函数。

好,从命令行运行这个脚本会得到下面的输出:

c:\docbook\dip\py>python BaseHTMLProcessor.py
SGMLParser = sgmllib.SGMLParser                1
htmlentitydefs = <module 'htmlentitydefs' from 'C:\Python21\lib\htmlentitydefs.py'> 2
BaseHTMLProcessor = __main__.BaseHTMLProcessor 3
__name__ = __main__                            4
[...略...]
1 SGMLParser 使用了 from module importsgmllib 中被导入。这就是说它被直接导入到我们的模块名字空间了,就是这样。is imported from sgmllib, using from module import. That means that it was imported directly into our module's namespace, and here it is./td>
2 每个模块都有一个 doc string(文档字符串),可以使用内置属性 __doc__ 来访问。这个模块没有明确地定义文档字符串,所以缺省为 None
3 这个模块仅定义了一个类,BaseHTMLProcessor,不错。注意这儿的值就是类本身,不是一个特别的类实例。
4 记得 if __name__ 技巧吗?当运行一个模块时(对从另外一个模块中导入而言),内置的 __name__ 是一个特殊值 __main__。因为我们是把这个模块当作脚本从命令来运行的,故 __name__ 值为 __main__,这就是为什么我们这段简单地打印 globals的代码可以执行的原因。
Note
使用 localsglobals 函数,通过提供变量的字符串名字你可以动态地得到任何变量的值。这种方法反映了 getattr) 函数(它允许你通过提供函数的字符串名来动态地访问任意的函数。)的机理。

localsglobals 之间有另外一个重要的区别,你应该在它困扰你之前就学了解它。它无论如何都会困扰你的,但至少你还记得了解过它。

例 4.12. locals 是只读的,globals 不是


def foo(arg):
    x = 1
    print locals()    1
    locals()["x"] = 2 2
    print "x=",x      3

z = 7
print "z=",z
foo(3)
globals()["z"] = 8    4
print "z=",z          5
1 因为使用 3 来调用 foo,会打印出 {'arg': 3, 'x': 1}。这个应该没什么奇怪的。
2

你可能认为这样会改变局部变量 x 的值为 2,但并不会。locals 实际上没有返回局部名字空间,它返回的是一个拷贝。所以对它进行改变对局部名字空间中的变量值并无影响。

3 这样会打印出 x= 1,而不是 x= 2
4

在有了对 locals 的经验之后,你可能认为这样不会改变 z 的值,但是可以。由于Python在实现过程中内部有所区别(关于这些区别我宁可不去研究,因为我自已还没有完全理解),globals 返回实际的全局名字空间,而不是一个拷贝:与 locals 的行为完全相反。所以对 globals 所返回的字典的任何的改动都会直接影响到全局变量。

5 这样会打印出 z= 8,而不是 z= 7

脚注

[9]我没有说得太多吧。