如何访问包含无效语法的现有(!)矩阵?
How to acces an existing(!) matrix which partly contains invalid syntax?
我使用 pdfminer 将 pdf 文本转换为 txt。 pdfminer 遍历 pdf 文件并逐行读取它。每行都分配给一个矩阵变量。
问题是,出于某种原因,在极少数情况下,矩阵是针对 e 的。 G。像 x =
[[Г, 'problems', -436, 'have', -448, 'usually', -435, 'found', -452]]
显然,不带引号的 Γ 是矩阵(或列表)的无效语法。然而,
x 存在但无法删除 Γ,可以理解 del x[0][0] 不起作用。
现在我正在询问如何访问 x 并删除第一个元素的想法。
非常感谢!
我解决了我的问题:
from ast import literal_eval
mr_x = str(x)
quote_pos = mr_x.find("'")
mr_x = '[[' + mr_x[quote_pos:]
x = literal_eval(mr_x)
print x
[['problems', -436, 'have', -448, 'usually', -435, 'found', -452]]
我使用 pdfminer 将 pdf 文本转换为 txt。 pdfminer 遍历 pdf 文件并逐行读取它。每行都分配给一个矩阵变量。 问题是,出于某种原因,在极少数情况下,矩阵是针对 e 的。 G。像 x =
[[Г, 'problems', -436, 'have', -448, 'usually', -435, 'found', -452]]
显然,不带引号的 Γ 是矩阵(或列表)的无效语法。然而, x 存在但无法删除 Γ,可以理解 del x[0][0] 不起作用。
现在我正在询问如何访问 x 并删除第一个元素的想法。 非常感谢!
我解决了我的问题:
from ast import literal_eval
mr_x = str(x)
quote_pos = mr_x.find("'")
mr_x = '[[' + mr_x[quote_pos:]
x = literal_eval(mr_x)
print x
[['problems', -436, 'have', -448, 'usually', -435, 'found', -452]]