dart - select 组字符串使用 RegExp
dart - select group of string use RegExp
正在从我的字符串中搜索并提取字符串组:
我的字符串
hello, my name is dev and ..., OK :#E8J+Yng==#::#E8J+Yng==#:, and i just:#E8J+YjQ==#:,:#E8J+YsA==#:
原始字符串是
hello, my name is dev and ..., OK , and i just,
我通过以下 class
得到这个字符串
import 'dart:convert' as converter;
class EmojiMessages{
static String regStr=r"(?:[\u2700-\u27bf]|(?:\ud83c[\udde6-\uddff]){2}|[\ud800-\udbff][\udc00-\udfff]|[\u0023-\u0039]\ufe0f?\u20e3|\u3299|\u3297|\u303d|\u3030|\u24c2|\ud83c[\udd70-\udd71]|\ud83c[\udd7e-\udd7f]|\ud83c\udd8e|\ud83c[\udd91-\udd9a]|\ud83c[\udde6-\uddff]|\ud83c[\ude01-\ude02]|\ud83c\ude1a|\ud83c\ude2f|\ud83c[\ude32-\ude3a]|\ud83c[\ude50-\ude51]|\u203c|\u2049|[\u25aa-\u25ab]|\u25b6|\u25c0|[\u25fb-\u25fe]|\u00a9|\u00ae|\u2122|\u2139|\ud83c\udc04|[\u2600-\u26FF]|\u2b05|\u2b06|\u2b07|\u2b1b|\u2b1c|\u2b50|\u2b55|\u231a|\u231b|\u2328|\u23cf|[\u23e9-\u23f3]|[\u23f8-\u23fa]|\ud83c\udccf|\u2934|\u2935|[\u2190-\u21ff])";
static RegExp regExp=RegExp(regStr);
static String startEmoji=":#E";
static String endEmoji="#:";
static String encodeEmojiText(String msg){
List<String> emojis=regExp.allMatches(msg).map((e)=>e.group(0)).toList();
List<String> codedEmojis=emojis.map((e)=>startEmoji+converter.base64.encode(converter.utf8.encode(e))+endEmoji).toList();
for(var i=0; i<emojis.length; i++){
msg=msg.replaceAll(emojis[i], codedEmojis[i]);
}
return msg;
}
static String decodeEmojiText(String msg){
//todo revers emoji base64
return msg;
}
}
var str="hello, my name is dev and ..., OK , and i just,";
print(EmojiMessages.encodeEmojiText(str));//hello, my name is dev and ..., OK :#E8J+Yng==#::#E8J+Yng==#:, and i just:#E8J+YjQ==#:,:#E8J+YsA==#:
我需要的,只需将正则表达式等顶级代码反转为 select :#E
base64#:
再次获取原始字符串。
我为什么要这样做?
存储没有空格的数据,在我的API需要发送普通消息字符串
- 请:
- 如果 base64 编码方式错误,请告诉我。
- 如果 base64 编码方式不可逆,请告诉我。
- 耐心点,我的 RegExp 很弱
谢谢你ThaiKV
您可以选择任何类型的纯文本表示形式,以确保您的 Unicode 数据在转换为 ASCII 时安全,Base64 是一种安全格式。
您编写编码方法的方式不是最优的,当您需要将子字符串与正则表达式匹配时,您应该只使用 .replaceAllMapped
,操作它们然后粘贴回字符串中。首先提取匹配项,转换数据并 运行 在每次操作后替换是资源消耗。
所以,我会这样写你的 EmojiMessages
class:
class EmojiMessages{
static String regStr=r"(?:[\u2700-\u27bf]|(?:\ud83c[\udde6-\uddff]){2}|[\ud800-\udbff][\udc00-\udfff]|[\u0023-\u0039]\ufe0f?\u20e3|\u3299|\u3297|\u303d|\u3030|\u24c2|\ud83c[\udd70-\udd71]|\ud83c[\udd7e-\udd7f]|\ud83c\udd8e|\ud83c[\udd91-\udd9a]|\ud83c[\udde6-\uddff]|\ud83c[\ude01-\ude02]|\ud83c\ude1a|\ud83c\ude2f|\ud83c[\ude32-\ude3a]|\ud83c[\ude50-\ude51]|\u203c|\u2049|[\u25aa-\u25ab]|\u25b6|\u25c0|[\u25fb-\u25fe]|\u00a9|\u00ae|\u2122|\u2139|\ud83c\udc04|[\u2600-\u26FF]|\u2b05|\u2b06|\u2b07|\u2b1b|\u2b1c|\u2b50|\u2b55|\u231a|\u231b|\u2328|\u23cf|[\u23e9-\u23f3]|[\u23f8-\u23fa]|\ud83c\udccf|\u2934|\u2935|[\u2190-\u21ff])";
static String startEmoji=":#E";
static String endEmoji="#:";
static RegExp regExp=RegExp(regStr);
static RegExp regExp_dec_emoji = new RegExp("$startEmoji(.*?)$endEmoji");
static String encodeEmojiText(String msg){
return msg.replaceAllMapped(regExp,
(Match m) => "$startEmoji${converter.base64.encode(converter.utf8.encode(m[0]))}$endEmoji");
}
static String decodeEmojiText(String msg){
return msg.replaceAllMapped(regExp_dec_emoji,
(Match m) => converter.utf8.decode(converter.base64.decode(m[1])));
}
}
测试:
var str="hello, my name is dev and ..., OK , and i just,";
print(str);
// => hello, my name is dev and ..., OK , and i just,
String encstr = EmojiMessages.encodeEmojiText(str);
print(encstr);
// => hello, my name is dev and ..., OK :#E8J+Yng==#::#E8J+Yng==#:, and i just:#E8J+YjQ==#:,:#E8J+YsA==#:
print(EmojiMessages.decodeEmojiText(encstr));
// => hello, my name is dev and ..., OK , and i just,
注释:
regExp_dec_emoji
是一个简单的正则表达式,捕获两个字符串 :#E(.*?)#:
之间的任何类型的零个或多个字符(换行符除外)
converter.utf8.decode(converter.base64.decode(m[1]))
用于解码第1组值,:#E
和最左边的#:
. 之间的字符串
正在从我的字符串中搜索并提取字符串组:
我的字符串
hello, my name is dev and ..., OK :#E8J+Yng==#::#E8J+Yng==#:, and i just:#E8J+YjQ==#:,:#E8J+YsA==#:
原始字符串是
hello, my name is dev and ..., OK , and i just,
我通过以下 class
import 'dart:convert' as converter;
class EmojiMessages{
static String regStr=r"(?:[\u2700-\u27bf]|(?:\ud83c[\udde6-\uddff]){2}|[\ud800-\udbff][\udc00-\udfff]|[\u0023-\u0039]\ufe0f?\u20e3|\u3299|\u3297|\u303d|\u3030|\u24c2|\ud83c[\udd70-\udd71]|\ud83c[\udd7e-\udd7f]|\ud83c\udd8e|\ud83c[\udd91-\udd9a]|\ud83c[\udde6-\uddff]|\ud83c[\ude01-\ude02]|\ud83c\ude1a|\ud83c\ude2f|\ud83c[\ude32-\ude3a]|\ud83c[\ude50-\ude51]|\u203c|\u2049|[\u25aa-\u25ab]|\u25b6|\u25c0|[\u25fb-\u25fe]|\u00a9|\u00ae|\u2122|\u2139|\ud83c\udc04|[\u2600-\u26FF]|\u2b05|\u2b06|\u2b07|\u2b1b|\u2b1c|\u2b50|\u2b55|\u231a|\u231b|\u2328|\u23cf|[\u23e9-\u23f3]|[\u23f8-\u23fa]|\ud83c\udccf|\u2934|\u2935|[\u2190-\u21ff])";
static RegExp regExp=RegExp(regStr);
static String startEmoji=":#E";
static String endEmoji="#:";
static String encodeEmojiText(String msg){
List<String> emojis=regExp.allMatches(msg).map((e)=>e.group(0)).toList();
List<String> codedEmojis=emojis.map((e)=>startEmoji+converter.base64.encode(converter.utf8.encode(e))+endEmoji).toList();
for(var i=0; i<emojis.length; i++){
msg=msg.replaceAll(emojis[i], codedEmojis[i]);
}
return msg;
}
static String decodeEmojiText(String msg){
//todo revers emoji base64
return msg;
}
}
var str="hello, my name is dev and ..., OK , and i just,";
print(EmojiMessages.encodeEmojiText(str));//hello, my name is dev and ..., OK :#E8J+Yng==#::#E8J+Yng==#:, and i just:#E8J+YjQ==#:,:#E8J+YsA==#:
我需要的,只需将正则表达式等顶级代码反转为 select :#E
base64#:
再次获取原始字符串。
我为什么要这样做?
存储没有空格的数据,在我的API需要发送普通消息字符串
- 请:
- 如果 base64 编码方式错误,请告诉我。
- 如果 base64 编码方式不可逆,请告诉我。
- 耐心点,我的 RegExp 很弱
谢谢你ThaiKV
您可以选择任何类型的纯文本表示形式,以确保您的 Unicode 数据在转换为 ASCII 时安全,Base64 是一种安全格式。
您编写编码方法的方式不是最优的,当您需要将子字符串与正则表达式匹配时,您应该只使用 .replaceAllMapped
,操作它们然后粘贴回字符串中。首先提取匹配项,转换数据并 运行 在每次操作后替换是资源消耗。
所以,我会这样写你的 EmojiMessages
class:
class EmojiMessages{
static String regStr=r"(?:[\u2700-\u27bf]|(?:\ud83c[\udde6-\uddff]){2}|[\ud800-\udbff][\udc00-\udfff]|[\u0023-\u0039]\ufe0f?\u20e3|\u3299|\u3297|\u303d|\u3030|\u24c2|\ud83c[\udd70-\udd71]|\ud83c[\udd7e-\udd7f]|\ud83c\udd8e|\ud83c[\udd91-\udd9a]|\ud83c[\udde6-\uddff]|\ud83c[\ude01-\ude02]|\ud83c\ude1a|\ud83c\ude2f|\ud83c[\ude32-\ude3a]|\ud83c[\ude50-\ude51]|\u203c|\u2049|[\u25aa-\u25ab]|\u25b6|\u25c0|[\u25fb-\u25fe]|\u00a9|\u00ae|\u2122|\u2139|\ud83c\udc04|[\u2600-\u26FF]|\u2b05|\u2b06|\u2b07|\u2b1b|\u2b1c|\u2b50|\u2b55|\u231a|\u231b|\u2328|\u23cf|[\u23e9-\u23f3]|[\u23f8-\u23fa]|\ud83c\udccf|\u2934|\u2935|[\u2190-\u21ff])";
static String startEmoji=":#E";
static String endEmoji="#:";
static RegExp regExp=RegExp(regStr);
static RegExp regExp_dec_emoji = new RegExp("$startEmoji(.*?)$endEmoji");
static String encodeEmojiText(String msg){
return msg.replaceAllMapped(regExp,
(Match m) => "$startEmoji${converter.base64.encode(converter.utf8.encode(m[0]))}$endEmoji");
}
static String decodeEmojiText(String msg){
return msg.replaceAllMapped(regExp_dec_emoji,
(Match m) => converter.utf8.decode(converter.base64.decode(m[1])));
}
}
测试:
var str="hello, my name is dev and ..., OK , and i just,";
print(str);
// => hello, my name is dev and ..., OK , and i just,
String encstr = EmojiMessages.encodeEmojiText(str);
print(encstr);
// => hello, my name is dev and ..., OK :#E8J+Yng==#::#E8J+Yng==#:, and i just:#E8J+YjQ==#:,:#E8J+YsA==#:
print(EmojiMessages.decodeEmojiText(encstr));
// => hello, my name is dev and ..., OK , and i just,
注释:
regExp_dec_emoji
是一个简单的正则表达式,捕获两个字符串:#E(.*?)#:
之间的任何类型的零个或多个字符(换行符除外)
converter.utf8.decode(converter.base64.decode(m[1]))
用于解码第1组值,:#E
和最左边的#:
. 之间的字符串