DBMS - 清理数据集
DBMS - Cleaning dataset
我目前正在清理要存储在数据库中的所有数据。
我遇到的问题之一是某些属性包含制表符。但是,制表符也用作分隔符,因此 DBMS 可能会错误地认为相关行中存在一个附加属性。
我尝试了以下 bash 脚本:
cat titles.csv | sed -i 's/\\t//g' > titles_copy.csv
但我得到的只是:“sed:没有输入文件”
这是为什么?我明确指定了输入文件。
因为您正在使用 STDIN 流,即 /dev/stdin
作为就地编辑操作的输入 sed -i
。
像这样使用它:
sed -i 's/\\t//g' titles.csv
或者当您将输出保存到不同的文件时,不需要 -i
:
sed 's/\\t//g' titles.csv >titles_copy.csv
我目前正在清理要存储在数据库中的所有数据。 我遇到的问题之一是某些属性包含制表符。但是,制表符也用作分隔符,因此 DBMS 可能会错误地认为相关行中存在一个附加属性。
我尝试了以下 bash 脚本:
cat titles.csv | sed -i 's/\\t//g' > titles_copy.csv
但我得到的只是:“sed:没有输入文件” 这是为什么?我明确指定了输入文件。
因为您正在使用 STDIN 流,即 /dev/stdin
作为就地编辑操作的输入 sed -i
。
像这样使用它:
sed -i 's/\\t//g' titles.csv
或者当您将输出保存到不同的文件时,不需要 -i
:
sed 's/\\t//g' titles.csv >titles_copy.csv