什么是 “内存管理机制”?


Python内存池
1、为什么要引入内存池(why)
python中的内存管理机制为Pymalloc
2、内存池是如何工作的(how)

Python的对象管理主要位于Level+1~Level+3层 Level+3层:对于python内置的对象(比如int,dict等)都有独立的私有内存池,对象之间的内存池不共享,即int释放的内存,不会被分配给float使用 Level+2层:当申请的内存大小小于256KB时,内存分配主要由 Python 对象分配器(Python’s object allocator)实施 Level+1层:当申请的内存大小大于256KB时,由Python原生的内存分配器进行分配,本质上是调用C标准库中的malloc/realloc等函数
关于释放内存方面,当一个对象的引用计数变为0时,Python就会调用它的析构函数。调用析构函数并不意味着最终一定会调用free来释放内存空间,如果真是这样的话,那频繁地申请、释放内存空间会使Python的执行效率大打折扣。因此在析构时也采用了内存池机制,从内存池申请到的内存会被归还到内存池中,以避免频繁地申请和释放动作。

垃圾回收机制
1、引用计数
>>> a=[1,2]
>>> import sys
>>> sys.getrefcount(a) ## 获取对象a的引用次数
2
>>> b=a
>>> sys.getrefcount(a)
3
>>> del b ## 删除b的引用
>>> sys.getrefcount(a)
2
>>> c=list()
>>> c.append(a) ## 加入到容器中
>>> sys.getrefcount(a)
3
>>> del c ## 删除容器,引用-1
>>> sys.getrefcount(a)
2
>>> b=a
>>> sys.getrefcount(a)
3
>>> a=[3,4] ## 重新赋值
>>> sys.getrefcount(a)
2
注意:当把a作为参数传递给getrefcount时,会产生一个临时的引用,因此得出来的结果比真实情况+1
引用计数增加的情况:
一个对象被分配给一个新的名字(例如:a=[1,2]) 将其放入一个容器中(如列表、元组或字典)(例如:c.append(a))
引用计数减少的情况:
使用del语句对对象别名显式的销毁(例如:del b) 对象所在的容器被销毁或从容器中删除对象(例如:del c ) 引用超出作用域或被重新赋值(例如:a=[3,4])
引用计数能够解决大多数垃圾回收的问题,但是遇到两个对象相互引用的情况,del语句可以减少引用次数,但是引用计数不会归0,对象也就不会被销毁,从而造成了内存泄漏问题。针对该情况,Python引入了标记-清除机制。
2、标记-清除
标记阶段,遍历所有的对象,如果是可达的(reachable),也就是还有对象引用它,那么就标记该对象为可达;
清除阶段,再次遍历对象,如果发现某个对象没有标记为可达(即为Unreachable),则就将其回收。
>>> a=[1,2]
>>> b=[3,4]
>>> sys.getrefcount(a)
2
>>> sys.getrefcount(b)
2
>>> a.append(b)
>>> sys.getrefcount(b)
3
>>> b.append(a)
>>> sys.getrefcount(a)
3
>>> del a
>>> del b
a引用b,b引用a,此时两个对象各自被引用了2次(去除getrefcout()的临时引用)

执行del之后,对象a,b的引用次数都-1,此时各自的引用计数器都为1,陷入循环引用

标记:找到其中的一端a,因为它有一个对b的引用,则将b的引用计数-1

标记:再沿着引用到b,b有一个a的引用,将a的引用计数-1,此时对象a和b的引用次数全部为0,被标记为不可达(Unreachable)

清除: 被标记为不可达的对象就是真正需要被释放的对象
上面描述的垃圾回收的阶段,会暂停整个应用程序,等待标记清除结束后才会恢复应用程序的运行。为了减少应用程序暂停的时间,Python 通过“分代回收”(Generational Collection)以空间换时间的方法提高垃圾回收效率。
3、分代回收
分代回收是基于这样的一个统计事实,对于程序,存在一定比例的内存块的生存周期比较短;而剩下的内存块,生存周期会比较长,甚至会从程序开始一直持续到程序结束。生存期较短对象的比例通常在 80%~90%之间。因此,简单地认为:对象存在时间越长,越可能不是垃圾,应该越少去收集。这样在执行标记-清除算法时可以有效减小遍历的对象数,从而提高垃圾回收的速度,是一种以空间换时间的方法策略。
gc扫描次数(第0代>第1代>第2代)
>>> import gc
>>> gc.get_threshold() ## 分代回收机制的参数阈值设置
(700, 10, 10)
700=新分配的对象数量-释放的对象数量,第0代gc扫描被触发 第一个10:第0代gc扫描发生10次,则第1代的gc扫描被触发
第二个10:第1代的gc扫描发生10次,则第2代的gc扫描被触发
4、思考
在标记-清除中,如果对象c也引用a,执行del操作后,会发生什么?
对象a,b,c的引用关系如下图所示:
>>> a=[1,2]
>>> b=[3,4]
>>> c=a
>>> a.append(b)
>>> b.append(a)

ref_count表示引用计数 对象a,b,c全部为reachable
执行del之后,引用关系如下图所示:
>>> del a
>>> del b

a,b,c的ref_count减1
执行gc扫描
标记: a引用b,将b的refcount减1到0,b引用a,将a的refcount减1到1,将b放在unreachable下。 
再循环:因为a是可达的,所以会递归地将从a节点出发可以达到的所有节点标记为reachable下,即为:? 
清除:unreachable下没有可清除的对象,因此a,b,c对象不会被清除

总结


更多精彩推荐 ?6 年成为 AIoT 独角兽,这位 17 年连续创业者是如何做到的? ?5G 时代,将边缘计算进行到底! ?被称为“Google 最大黑科技”,开发谷歌大脑,这位 AI 掌门人到底有多牛? ?Python, C++和Java代码互翻,Facebook开发首个自监督神经编译器 ?MongoDB 计划从“Data Sprawl”中逃脱 ?离岸密码的未来:概述 点分享 点点赞 点在看
关注公众号:拾黑(shiheibook)了解更多
[广告]赞助链接:
四季很好,只要有你,文娱排行榜:https://www.yaopaiming.com/
让资讯触达的更精准有趣:https://www.0xu.cn/
关注网络尖刀微信公众号随时掌握互联网精彩
- 1 打好关键核心技术攻坚战 7904651
- 2 韩国硬刚高市早苗 7809159
- 3 售价约20元 水银温度计平替长这样 7714224
- 4 持续巩固增强经济回升向好态势 7616472
- 5 生鲜灯不能两年都关不了 7520974
- 6 71岁的成龙回应“龙叔老了” 7428586
- 7 泽连斯基称乌已准备好举行选举 7330842
- 8 在南海坠毁的2架美国军机已被捞出 7236437
- 9 怀孕或使女性衰老超5岁 7139840
- 10 我国成功发射遥感四十七号卫星 7040294











CSDN
