删除引号前后的所有字符
Delete all characters before and after quotation marks
我有一个 CSV 文件,它有两列和 4500 行。在一栏中,我有几个用引号括起来的短语。我需要删除引号前后的所有文本。
例如:
How would you say "Hello, my Friend" when speaking outside?
should become "Hello, my Friend"
我还有几行在第二列中有 NULL 一词。我需要完全删除这些行。
做这样的事情最好的方法是什么?我一直在研究正则表达式,但我不确定它们是否足够灵活以执行我想执行的操作,或者您将如何在 CSV 文件中使用它们(我需要保留 table 结构) .
编辑:
1) 目前我只是在使用 Apple Numbers,但我知道不会,所以我很乐意接受任何建议。它必须支持汉字字符。
2) 我删除了所有 NULL 行,因此不再需要(我只是添加了一列数字,对 table 进行排序,因此所有 NULL 都在一起,删除它们并排序回来按数字列)。
寻找支持正则表达式搜索和替换的文本编辑器。
类似这样的内容将匹配第二列中的 ,NULL
:^.*,NULL.*$
。将其替换为 "DELETEMEDELETEME" 以标记该行,或将其替换为空字符串或找到一种方法使其与“\n”或“\r”匹配以捕获换行符并完全删除整行。
去除引号字符串的一部分可能会像这样工作:
^(.*,){n}(.*)(\".\")(.*)(,.*)$
替换为 </code>,其中 n 是您要编辑的列之前的列数。如果不可用,请重复 <code>(.*,)
。这将取决于您的工具的正则表达式风格。
我有一个 CSV 文件,它有两列和 4500 行。在一栏中,我有几个用引号括起来的短语。我需要删除引号前后的所有文本。
例如:
How would you say "Hello, my Friend" when speaking outside?
should become "Hello, my Friend"
我还有几行在第二列中有 NULL 一词。我需要完全删除这些行。
做这样的事情最好的方法是什么?我一直在研究正则表达式,但我不确定它们是否足够灵活以执行我想执行的操作,或者您将如何在 CSV 文件中使用它们(我需要保留 table 结构) .
编辑: 1) 目前我只是在使用 Apple Numbers,但我知道不会,所以我很乐意接受任何建议。它必须支持汉字字符。
2) 我删除了所有 NULL 行,因此不再需要(我只是添加了一列数字,对 table 进行排序,因此所有 NULL 都在一起,删除它们并排序回来按数字列)。
寻找支持正则表达式搜索和替换的文本编辑器。
类似这样的内容将匹配第二列中的 ,NULL
:^.*,NULL.*$
。将其替换为 "DELETEMEDELETEME" 以标记该行,或将其替换为空字符串或找到一种方法使其与“\n”或“\r”匹配以捕获换行符并完全删除整行。
去除引号字符串的一部分可能会像这样工作:
^(.*,){n}(.*)(\".\")(.*)(,.*)$
替换为 </code>,其中 n 是您要编辑的列之前的列数。如果不可用,请重复 <code>(.*,)
。这将取决于您的工具的正则表达式风格。