如何序列化 CSR 矩阵

How to Serialize CSR Matrix

我有一个 csr_matrix 个对象从 TfidfTransformer.transform 计算得出。我想序列化或反序列化:

tf_csrmtrix = TfidfTransformer.transform(data)
json.dumps(tf_csrmtrix)
TypeError: Object of type 'csr_matrix' is not JSON serializable

我该如何处理这个数据之王:csr 矩阵?

如果二进制序列化格式可以解决问题,我会建议 pickle module

只是 import pickle 并在您使用 json.dumps 的地方使用 pickle.dumps(注意这给出了 bytes-object 而不是像 json 那样的字符串)

您应该能够写入文件、数据库或某些套接字,然后加载它(使用 pickle),以获得完全相同的对象