如何使用 Java 从独立于平台的文本文件中删除 ^M 个字符?
How to remove ^M characters from a text file independent of platform using Java?
我正在尝试找出如何从使用以下代码从 Java 代码生成的文本文件中删除 ^M 个字符。
public StringBuilder toCsv(Table table) {
StringBuilder stringBuilder = new StringBuilder();
String csv = new String();
for (Column cName : table.getColumns()){
csv += QUOT;
csv += cName.getName();
csv += QUOT;
csv += CSV_SEPERATOR;
}
csv += "\n";
stringBuilder.append(csv);
for (Row row : table) {
Collection<Object> values = row.values();
String csvString = "";
if (values.size() == 10) {
String ep = QUOT + CSV_SEPERATOR + QUOT ;
csvString = StringUtils.join(row.values(),ep );
csvString.replaceAll("\'", "");
csvString = QUOT + csvString + QUOT;
logger.info("line ++++ " + csvString);
}
stringBuilder.append(csvString);
stringBuilder.append("\n");
}
return stringBuilder;
}
然后我使用以下方法将数据写入文件
public void writeCsv(String data, String path, String fileName) throws IOException {
String completePath = path + "/" + fileName;
Writer out = new BufferedWriter(new OutputStreamWriter(
new FileOutputStream(completePath)));
try {
out.write(data);
} finally {
out.close();
}
}
上下文
我正在使用 http://jackcess.sourceforge.net/ 从 Microsoft 访问 (.mdb) 文件生成 CSV 文件。当我生成 csv 并使用 vim 打开时,我在行中间看到很多 ^M。注意:我使用的是 MacOS
我已经尝试在写入 csv
之前删除 ^M(我认为它是一个 MS Windows CARRIAGE_RETURN)
csvLine.replaceAll("\n\r", "");
和
csvLine.replaceAll("\r\n", "");
和
csvLine.replaceAll("\r", "");
生成的 CSV
'10773.0';'';'';'';'Thu Jul 14 00:00:00 CEST 2016';'By Cash';'';'10000.0';'';'2102.0'
'10001.0';'';'';'';'Thu Jul 14 00:00:00 CEST 2016';'Pet Soup cash';'087470^M
^M
^M
087470';'-45000.0';'';'2102.0'
'10360.0';'';'';'';'Thu Jul 14 00:00:00 CEST 2016';'By Cash';'';'37000.0';'';'2101.0'
'10444.0';'';'';'';'Thu Jul 14 00:00:00 CEST 2016';'By Cash';'';'2000.0';'';'2101.0'
如您所见,上面的 CSV 中有一行被 ^M 打断,这是不需要的。 我需要以编程方式从文件中删除此类字符。
删除 ^M 和后续行后的预期输出
'10001.0';'';'';'';'Thu Jul 14 00:00:00 CEST 2016';'Pet Soup cash';'087470087470';'-45000.0';'';'2102.0'
如有任何帮助,我们将不胜感激。
字符串是不可变的,所以.replaceAll
方法不会改变现有String的值;它执行替换和 returns 一个新的字符串值。所以,
String csvString = "123,foo,234";
csvString.replaceAll("foo", "");
System.out.println(csvString);
打印
123,foo,234
显示字符串未更改。你想做的是
String csvString = "123,foo,234";
csvString = csvString.replaceAll("foo", ""); // save the new value
System.out.println(csvString);
打印
123,,234
在您的特定情况下,您似乎想要这样做
csvString = csvString.replaceAll("\r\n", ""); // save the new value
因为您要删除 carriage_return(显示为 ^M
)和 new_line(开始新行在文本文件中)。
我正在尝试找出如何从使用以下代码从 Java 代码生成的文本文件中删除 ^M 个字符。
public StringBuilder toCsv(Table table) {
StringBuilder stringBuilder = new StringBuilder();
String csv = new String();
for (Column cName : table.getColumns()){
csv += QUOT;
csv += cName.getName();
csv += QUOT;
csv += CSV_SEPERATOR;
}
csv += "\n";
stringBuilder.append(csv);
for (Row row : table) {
Collection<Object> values = row.values();
String csvString = "";
if (values.size() == 10) {
String ep = QUOT + CSV_SEPERATOR + QUOT ;
csvString = StringUtils.join(row.values(),ep );
csvString.replaceAll("\'", "");
csvString = QUOT + csvString + QUOT;
logger.info("line ++++ " + csvString);
}
stringBuilder.append(csvString);
stringBuilder.append("\n");
}
return stringBuilder;
}
然后我使用以下方法将数据写入文件
public void writeCsv(String data, String path, String fileName) throws IOException {
String completePath = path + "/" + fileName;
Writer out = new BufferedWriter(new OutputStreamWriter(
new FileOutputStream(completePath)));
try {
out.write(data);
} finally {
out.close();
}
}
上下文
我正在使用 http://jackcess.sourceforge.net/ 从 Microsoft 访问 (.mdb) 文件生成 CSV 文件。当我生成 csv 并使用 vim 打开时,我在行中间看到很多 ^M。注意:我使用的是 MacOS
我已经尝试在写入 csv
之前删除 ^M(我认为它是一个 MS Windows CARRIAGE_RETURN) csvLine.replaceAll("\n\r", "");
和
csvLine.replaceAll("\r\n", "");
和
csvLine.replaceAll("\r", "");
生成的 CSV
'10773.0';'';'';'';'Thu Jul 14 00:00:00 CEST 2016';'By Cash';'';'10000.0';'';'2102.0'
'10001.0';'';'';'';'Thu Jul 14 00:00:00 CEST 2016';'Pet Soup cash';'087470^M
^M
^M
087470';'-45000.0';'';'2102.0'
'10360.0';'';'';'';'Thu Jul 14 00:00:00 CEST 2016';'By Cash';'';'37000.0';'';'2101.0'
'10444.0';'';'';'';'Thu Jul 14 00:00:00 CEST 2016';'By Cash';'';'2000.0';'';'2101.0'
如您所见,上面的 CSV 中有一行被 ^M 打断,这是不需要的。 我需要以编程方式从文件中删除此类字符。
删除 ^M 和后续行后的预期输出
'10001.0';'';'';'';'Thu Jul 14 00:00:00 CEST 2016';'Pet Soup cash';'087470087470';'-45000.0';'';'2102.0'
如有任何帮助,我们将不胜感激。
字符串是不可变的,所以.replaceAll
方法不会改变现有String的值;它执行替换和 returns 一个新的字符串值。所以,
String csvString = "123,foo,234";
csvString.replaceAll("foo", "");
System.out.println(csvString);
打印
123,foo,234
显示字符串未更改。你想做的是
String csvString = "123,foo,234";
csvString = csvString.replaceAll("foo", ""); // save the new value
System.out.println(csvString);
打印
123,,234
在您的特定情况下,您似乎想要这样做
csvString = csvString.replaceAll("\r\n", ""); // save the new value
因为您要删除 carriage_return(显示为 ^M
)和 new_line(开始新行在文本文件中)。