符号和编码:这是什么符号?
Symbols and encoding: what symbol is this?
我正在处理一个充满数据的大型文本文件。那里的不同数据块由一个符号(或一对相似的符号)吐出,看起来有点奇怪和怪异。
我需要找出这是什么符号,以便在读取数据文件时正确(!)使用它来拆分数据块。你能帮我吗?
这是这对符号在 Whosebug“提问”编辑字段中的样子:
接下来我添加一些图片,说明符号在不同地方看起来有多么不同:
在原始数据文件中
在括号编辑器中(所有可用的编码都是一样的)
在 Brave Browser 搜索栏中
2019 年 Visual Studio
在 Whosebug 中(当我输入时和在发布的问题中时不同)编辑字段
某处它被转换为以下之一
使用 C# 和 Encoding.UTF8 编码读取符号时,控制台给出下一个结果:
但是当使用 Encoding.Unicode 时,控制台会给出一组无限的 smth,如下所示:
我究竟需要编写什么才能让我的 C# 代码识别并响应这些符号?
我用这个 unicode char finder 来找出字符是什么。
顺序是...
U+0003:文本结束 [ETX]
U+0001:标题开始 [SOH]
我正在处理一个充满数据的大型文本文件。那里的不同数据块由一个符号(或一对相似的符号)吐出,看起来有点奇怪和怪异。 我需要找出这是什么符号,以便在读取数据文件时正确(!)使用它来拆分数据块。你能帮我吗?
这是这对符号在 Whosebug“提问”编辑字段中的样子:
接下来我添加一些图片,说明符号在不同地方看起来有多么不同:
在原始数据文件中
在括号编辑器中(所有可用的编码都是一样的)
在 Brave Browser 搜索栏中
2019 年 Visual Studio
在 Whosebug 中(当我输入时和在发布的问题中时不同)编辑字段
某处它被转换为以下之一
使用 C# 和 Encoding.UTF8 编码读取符号时,控制台给出下一个结果:
但是当使用 Encoding.Unicode 时,控制台会给出一组无限的 smth,如下所示:
我究竟需要编写什么才能让我的 C# 代码识别并响应这些符号?
我用这个 unicode char finder 来找出字符是什么。
顺序是...
U+0003:文本结束 [ETX]
U+0001:标题开始 [SOH]