返回顶部

我需要将 Python3 对象腌制为我想从 Travis CI 构建中的环境变量中提取的字符串。问题是我似乎无法在 Python3 中找到一种方法来腌制可移植字符串(unicode): import os, pickle from my_module import MyPickleableClass obj = {'cls': MyPickleableClass, 'other_stuf': '(...)'} pickled = pickle.dumps(obj) # raises TypeError: str expected, not bytes os.environ['pickled'] = pickled # raises UnicodeDecodeError: 'utf-8' codec can't decode byte 0xbb (...) os.environ['pickled'] = pickled.decode('utf-8') pickle.loads(os.environ['pickled']) 有没有办法序列化复杂的对象,如datetime.datetimeunicode 或 Python3 中的其他字符串表示形式,我可以将其转移到不同的机器并反序列化? 更新 我已经测试了@kindall 建议的解决方案,但是pickle.dumps(obj, 0).decode()引发了UnicodeDecodeError. 尽管如此,base64方法仍然有效,但它需要额外的解码/编码步骤。该解决方案适用于 Python2.x 和 Python3.x。 # encode returns bytes so it needs to be decoded to string pickled = pickle.loads(codecs.decode(pickled.encode(), 'base64')).decode() type(pickled) # unpickled = pickle.loads(codecs.decode(pickled.encode(), 'base64'))

1

0/300

评论 1

卓越助教

pickle.dumps()产生一个bytes对象。期望这些任意字节是有效的 UTF-8 文本(您通过尝试将其解码为 UTF-8 字符串所做的假设)是相当乐观的。如果它成功了,那将是一个巧合! 一种解决方案是使用完全使用 ASCII 字符的旧式酸洗协议。这仍然显示为bytes,但由于它是纯 ASCII 的,因此可以毫无压力地解码为字符串: pickled = pickle.dumps(obj, 0).decode() 您还可以使用其他一些编码方法将二进制腌制对象编码为文本,例如 base64: import codecs pickled = codecs.encode(pickle.dumps(obj), "base64").decode() 解码将是: unpickled = pickle.loads(codecs.decode(pickled.encode(), "base64")) 与协议 0 一起使用pickle似乎会导致比 base64 编码二进制泡菜更短的字符串(并且 abarnert 建议的十六进制编码将比 base64 更大),但我没有严格测试它或任何东西。用你的数据测试它,看看。

2022-01-18 14:35:53

- 没有更多了 -