编写自定义类实现json和pickle文件的多行写入,多行读取

首先是json与pickle的介绍,然后是对于json不能多次dump的解决办法。


  • json与pickle

    • 序列化(serialization):将内存中的结构化数据转换成字节串。
    • 反序列化(deserialization):从文件中或网络中获取的数据转换成内存中原来的数据类型
    • 具体方法:dump、dumps、load、loads
      • dump与load是对文件进行操作(序列化与反序列化)
      • dumps与loads时对内存中的数据进行操作(序列化与反序列化)
  • pickle 写入多个对象,读取多个对象

    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    24
    25
    26
    27
    28
    29
    30
    31
    32
    33
    pickle支持多次dump,但对于读取文件,我们再不清楚内容(load多少次)时,使用try except EOFError

    class A:
    def __init__(self):
    self.li = []
    class B:
    def __init__(self):
    self.li = []
    a = A()
    a.li.append(1)
    b = B()
    b.li.append(2)

    import pickle
    class My_pickle():
    def __init__(self,path):
    self.path = path
    def dump(self,*args):
    with open(self.path,mode='wb') as f:
    for i in args:
    pickle.dump(i,f)
    def load(self):
    with open(self.path,mode='rb') as f:
    while 1:
    try:
    yield pickle.load(f)
    except EOFError:
    break

    p1 = My_pickle('test.pikle')
    p1.dump(a,b)
    for i in p1.load():
    print(i)
  • json写入多行

    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    20
    21
    22
    23
    方式一: 
    将待写入的多种数据(列表,元组,字典)放到一个列表中写入,读取时,将列表反序列化到内存,在逐个返回。
    缺点:一次性取出所有,内存占用大。
    import json
    class My_json():
    def __init__(self,file):
    self.file = file
    def dump(self,*args):
    with open(self.file,mode='w',encoding='utf-8') as f:
    li = []
    for i in args:
    li.append(i)
    json.dump(li,f)

    def load(self):
    with open(self.file,mode='r',encoding='utf-8') as f:
    ret = json.load(f)
    for j in ret:
    yield j
    j = My_json('test.json')
    j.dump([1,2,3,4,],'ssss')
    for i in j.load():
    print(i)
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    19
    方式二:   推荐
    将待写入的多种数据(列表,元组,字典)写入一种数据的同时写入一个\n,这样读取文件的时候,使用for遍历文件句柄,对于得到的字符串使用json.loads()方法进行反序列化。
    import json
    class My_json():
    def __init__(self,file):
    self.file = file
    def dump(self,*args):
    with open(self.file,mode='w',encoding='utf-8') as f:
    for i in args:
    json.dump(i,f)
    f.write('\n')
    def load(self):
    with open(self.file,encoding='utf-8') as f:
    for line in f:
    ret = json.loads(line)
    print(ret)
    j = My_json('test.json')
    j.dump([1,2,3,4,],'ssss')
    j.load()
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    15
    16
    17
    18
    方式三:   
    在方式二的基础上进行的小改,除了先dump(i)在write('\n'),我们还可以先用 dumps(i)序列化数据,然后再write(序列化数据 + '\n')
    import json
    class My_json():
    def __init__(self,file):
    self.file = file
    def dump(self,*args):
    with open(self.file,mode='w',encoding='utf-8') as f:
    for i in args:
    f.write(json.dumps(i) + '\n')
    def load(self):
    with open(self.file,encoding='utf-8') as f:
    for line in f:
    ret = json.loads(line)
    print(ret)
    j = My_json('test.json')
    j.dump([1,2,3,4,],'ssss')
    j.load()
  • pickle和json在对多行写入,写出的区别:

    • pickle 支持多次dump,所以对应着就可以多次load来取这个数据,但当我们不知道文件中有多少个或者不知道该load几次的时候,我们可以使用try except EOFError 来让它停止。
    • json 不支持多次dump,所以在dump一次后,在写入一个换行。 这样在读文件的时候,我们循环遍历文件句柄,读一行,用loads (注意这里的loads是因为,已经对内存的字符串进行处理/而不是文件)

-------------The End-------------

本文标题:编写自定义类实现json和pickle文件的多行写入,多行读取

文章作者:Naqin

发布时间:2019年04月05日 - 15:04

最后更新:2019年11月05日 - 01:11

原始链接:https://chennq.top/learn-python/20190405-python-json-and-pickle.html

许可协议: 署名-非商业性使用-禁止演绎 4.0 国际 转载请保留原文链接及作者。

Naqin wechat
欢迎看官加我微信!
坚持原创技术分享,您的支持将鼓励我继续创作!
0%