欢迎访问Python每天3分钟系列。
每天早上8点半,学习或温习一个Python知识点。
今天是第023篇:
对象序列化 Object Serialization
定义
从狭义上讲,对象序列化是指把一些内存中的对象转变成字节流,以便保存到文件或者通过网络传输。等以后再通过反序列化转变成内存中的对象。
从广义上讲,把对象转换成JSON,CSV等数据格式也被称为序列化。
序列化并不是Python特有的技术,几乎所有编程语言都有序列化技术。因为编程语言无非是一个解决问题的工具,不管用什么编程语言都要解决序列化的问题,也就是下面的场景。
场景
序列化的场景无非这几个:
-
把对象转换成JSON或XML格式,方便网络传输,通常是使用Rest API传输。 -
把对象转成字节流,方便远程方法调用。 远程方法调用,简单说就是你电脑上的程序调用另外一台机器的方法,这和调用自己的程序中的方法有本质区别,对象需要转成字节流通过网络传输。其实这种方法用的越来越少,因为大部分人会使用第一种方法中的API。
-
把对象转换成字节流保存到硬盘,以便下次回来可以继续。 假设你正在玩一个游戏,里面正热火朝天的玩着呢,各种角色(对象)创建了很多。忽然家长回来了,你需要马上关闭电脑。你肯定希望有一种能力可以保存现场,等家长出去了你可以回来继续接着玩,而不是回来从零开始玩。这就是对象序列化的绝佳场景。虽然你的游戏不一定使用对象序列化的技术。
再举一个例子,假设你在运算一个复杂的人工智能模型,这个模型很复杂,你用了三天三夜才计算到某一个中间结果,里面有100万个对象。这时候你也希望能够把对象保存起来,下次可以直接加载到内存快速继续,而不是从新开始三天三夜的运算或者从新构建100万个对象。
案例
假设我们用Python写了一个网络程序,计算出了2022年最受欢迎的4大美食,这个结果在内存中是一个列表list
,里面放着4个food
对象。
class Food:
def __init__(self, name, origin, calories, price):
self.name = name
self.origin = origin #产地
self.calories = calories #卡路里
self.price = price
print('...此处省略2500行推荐算法代码...')
food1 = Food('胡辣汤', '山东', 25, 2)
food2 = Food('油条', '山东', 88, 1)
food3 = Food('豆腐脑', '山东', 35, 2.5)
food4 = Food('焖饼', '山东', 65, 10)
recommend = [food1, food2, food3, food4]
以上美食表达了我对家乡思念。产地不一定是原产地,请自行改成自己喜欢的食物和产地。
下面,我们用两种方法给它做序列化,一种是字节流,一种是JSON。
pickle序列化
pickle是Python自带库,可以把对象转成字节流。下面的代码中我们把它保存到文件,你也可以通过网络传输给其他程序。
import pickle
with open("foods.pickle", "wb") as out:
pickle.dump(recommend, out)
运行后,发现多了一个文件:
打开后发现这样的字节流:
pickle反序列化
下面我们把这个字节流转换成对象。运行下面的程序前确保你的电脑上有相应的字节流文件:
import pickle
with open("foods.pickle", "rb") as out:
remote_recommend = pickle.load(out)
print(remote_recommend)
打印结果可以看到成功反序列化了列表,并且也还原了里面的4个Food
对象。
[<__main__.Food object at 0x1054f7dc0>, <__main__.Food object at 0x1054f7d60>, <__main__.Food object at 0x1054f7c10>, <__main__.Food object at 0x1054f7a30>]
JSON
好像超过3分钟了。JSON我们明天再聊。JSON是极其重要的数据格式,值得我们再花3分钟来学习。
感谢@嗷呜
同学在留言区提的这个话题。嗷呜
,你懂了吗?
评论(0)