延迟绑定出现在闭包问题中。下面我们看一个闭包的例子:1
2
3
4
5
6
7
8def gen_mul(n):
def mul(x):
return n*x
return mul
double = gen_mul(2)
doubled_value = double(6) # 12
可以看出满足闭包的几点:
- 有内部函数
- 内部函数引用了外部函数中的自由变量
- 内部函数被返回
闭包的优点:
- 可以避免使用全局变量
- 可以持久化变量,达到静态变量的作用
闭包的缺点:
可能会消耗大量的内存
可能会导致内存泄漏
当然缺点可以通过人为避免。
现在我们来看看另一个会引出延迟绑定的例子:1
2
3def multipliers():
return [lambda x : i * x for i in range(4)]
print([m(2) for m in multipliers()]) # [6,6,6,6]
上边的例子会输出[6,6,6,6],而不是我们预期的[0,2,4,6]。
这就是延迟绑定导致的结果。具体过程我们可以来分析下:
执行第三行时,会先执行multipliers函数,然后执行函数中的列表解析式。在每一次迭代的时候都会生成一个匿名函数(这里只是定义)作为元素。然后回到第三行,遍历返回的列表中的匿名函数,传入参数2并执行。此时函数类似于这样:1
2def noname(x):
return i * x
我们知道Python查找变量的作用域链的顺序依次为LEGB:
局部变量(L)->外部函数中的局部变量(E)->全局变量(G)->内置变量(B)
非常重要的一点我们需要知道:Python的作用域在编译时就已经形成了,而不是在运行时,函数的作用域与其被调用的位置无关。
那么在本例中,上面的noname函数体中的i从何而来呢?当然首先会到multipliers函数的局部变量中去寻找。此时i的值已经为3,所以出现这种让人”费解”的现象。
那么现在我们既然已经知道了原因,那么要怎样解决呢?
我们可以将迭代的i值直接注入到匿名函数的函数体中,这里给出两种方法:
通过为参数设置默认值,这是因为在编译时就会计算确定默认值:
1
2def multipliers_ch1():
return [lambda m,x=i : m * x for i in range(4)]通过内置函数partial:
1
2
3from functools import partial
def multipliers_ch2():
return [partial(lambda m,x : m * x,i) for i in range(4)]利用生成器的延迟计算:
1
2
3def multipliers_ch3():
for m in range(4):
yield lambda x: m * xpartial及生成器的内容会在以后分享。
运行结果1
2
3print([m(2) for m in multipliers_ch1()]) # [0,2,4,6]
print([m(2) for m in multipliers_ch2()]) # [0,2,4,6]
print([m(2) for m in multipliers_ch3()]) # [0,2,4,6]
注:
自由变量:指未在本地作用域中绑定的变量,我们可通过访问函数的__code__属性进行查看:
fun.__code__.co_freevars
LEGB: 可看该部分解释