在出现 n 个数字后拆分字符串
Split string after n amount of digits occurrence
我在这里解析一些文件夹名称。我有一个程序可以列出文件夹的子文件夹并解析文件夹名称。
例如,一个文件夹可以这样命名:
"Folder.Name.1234.Some.Info.Here-ToBeParsed"
我想解析它所以名称是 "Folder Name"。目前我首先使用 string.replaceAll() 来去除特殊字符,然后是这个 4 位序列。我想在那一点上拆分字符串。我怎样才能做到这一点?
目前我的代码看起来像这样:
// Parsing string if regex p matches folder's name
if(b) {
//System.out.println("Folder: \" " + name + "\" contains special characters.");
String result = name.replaceAll("[\p{P}\p{S}]", " "); // Getting rid of all punctuations and symbols.
//System.out.println("Parsed: " + name + " > " + result);
// If string matches regex p2
if(b2) {
//System.out.println("Folder: \" " + result + "\" contains release year.");
String parsed_name[] = result.split("20"); // This is the line i would like to split when 4-digits in row occur.
//System.out.println("Parsed: " + result + " > " + parsed_name[0]);
movieNames.add(parsed_name[0]);
}
或者也许有更简单的方法来做到这一点?提前致谢!
你应该像这样保持简单:
String name = "Folder.Name.1234.Some.Info.Here-ToBeParsed";
String repl = name.replaceFirst( "\.\d{4}.*", "" ).
replaceAll( "[\p{P}\p{S}&&[^']]+", " " );
//=> Folder Name
replaceFirst
正在删除点和 4 位数字后的所有内容
replaceAll
将所有标点符号和 space(撇号除外)替换为单个 space
我在这里解析一些文件夹名称。我有一个程序可以列出文件夹的子文件夹并解析文件夹名称。
例如,一个文件夹可以这样命名:
"Folder.Name.1234.Some.Info.Here-ToBeParsed"
我想解析它所以名称是 "Folder Name"。目前我首先使用 string.replaceAll() 来去除特殊字符,然后是这个 4 位序列。我想在那一点上拆分字符串。我怎样才能做到这一点?
目前我的代码看起来像这样:
// Parsing string if regex p matches folder's name
if(b) {
//System.out.println("Folder: \" " + name + "\" contains special characters.");
String result = name.replaceAll("[\p{P}\p{S}]", " "); // Getting rid of all punctuations and symbols.
//System.out.println("Parsed: " + name + " > " + result);
// If string matches regex p2
if(b2) {
//System.out.println("Folder: \" " + result + "\" contains release year.");
String parsed_name[] = result.split("20"); // This is the line i would like to split when 4-digits in row occur.
//System.out.println("Parsed: " + result + " > " + parsed_name[0]);
movieNames.add(parsed_name[0]);
}
或者也许有更简单的方法来做到这一点?提前致谢!
你应该像这样保持简单:
String name = "Folder.Name.1234.Some.Info.Here-ToBeParsed";
String repl = name.replaceFirst( "\.\d{4}.*", "" ).
replaceAll( "[\p{P}\p{S}&&[^']]+", " " );
//=> Folder Name
replaceFirst
正在删除点和 4 位数字后的所有内容replaceAll
将所有标点符号和 space(撇号除外)替换为单个 space