Python面经【4】
- 一、什么是闭包
- 二、[列表]和(元组)的区别
- 三、__Init__和__new__的区别
- 四、Python里match与search的区别
- 五、创建百万级实例如何节省内存
- [六、18. 4G内存如何读取一个5G的数据](#六、18. 4G内存如何读取一个5G的数据)
一、什么是闭包
闭包指的是在函数内部定义了另一个函数,并返回了这个作为函数的对象,同时还保存了外层函数的状态信息。这个内部函数可以引用外层函数的变量和参数,而且外层函数返回的是这个内部函数的引用。这种在函数内部定义函数并返回的方式称为闭包。
二、[列表]和(元组)的区别
- 列表是可变的,在创建之后可以对其进行任意的修改。
- 元组是不可变的,元组一旦创建,便不能对其进行更改,可以把元组当作一个只读版的列表。
- 元组无法复制
- Python将低开销的较大的块分配给元组,因为它们是不可变的。对于列表则分配小内存块。与列表相比,元组的内存更小。当拥有大量元素时,元组比列表快。
三、__Init__和__new__的区别
- 同
二者均是python面向对象语言中的函数,__new__比较少用,__init__则用的比较多。 - 异
- __new__是在实例创建之前被调用的,因为它的任务就是创建实例然后返回该实例对象,是个静态方法。
- __init__是当实例对象创建完成后被调用的,然后设置对象属性的一些初始值,通常用在初始化一个类实例的时候。是一个实例方法。
简单来说:__new__先被调用,__init__后被调用,__new__的返回值(实例)将传递给__init__方法的第一个参数,然后__init__给这个实例设置一些参数
四、Python里match与search的区别
- match函数用于从字符串的开头开始匹配模式,只要从开头匹配成功即可。
- Search函数用于在整个字符串中搜索模式,返回第一个匹配成功的结果。
- 也就是说match只有在0位置匹配成功的话才会返回,如果不是开始位置匹配成功的话,match就返回none。
五、创建百万级实例如何节省内存
- 可以定义类的__slots__()属性,用它来声明实例属性的列表,可以用来减少内存空间的目的。
- 相比没有用slots声明实例属性的列表,多了一个__dict__,这是一个动态绑定属性的特性,其实是以牺牲内存为代价的,因为这个__dict__它本身是占用内存的。
- 当定义了slots属性时,python就会针对实例采用一种更紧凑的内部表示,不在让每个实例都创建一个dict字典。
- 使用slots带来的副作用是们没法再对实例添加任何新的属性了,我们被限制为只允许使用slots中列出的那些属性名。
六、18. 4G内存如何读取一个5G的数据
- 方法一:
通过生成器,分多次读取,每次读取数量相对少的数据(比如500MB)进行处理,处理结束后再读取后面的500MB的数据 - 方法二:
可以通过Linux命令split切割成小文件,然后再对数据进行处理,此方法效率比较高。可以按照行数进行切割,可以按照文件大小切割。