符号和编码:这是什么符号?

Symbols and encoding: what symbol is this?

我正在处理一个充满数据的大型文本文件。那里的不同数据块由一个符号(或一对相似的符号)吐出,看起来有点奇怪和怪异。 我需要找出这是什么符号,以便在读取数据文件时正确(!)使用它来拆分数据块。你能帮我吗?

这是这对符号在 Whosebug“提问”编辑字段中的样子:

接下来我添加一些图片,说明符号在不同地方看起来有多么不同:

在原始数据文件中

在括号编辑器中(所有可用的编码都是一样的)

在 Brave Browser 搜索栏中

2019 年 Visual Studio

在 Whosebug 中(当我输入时和在发布的问题中时不同)编辑字段

某处它被转换为以下之一

使用 C# 和 Encoding.UTF8 编码读取符号时,控制台给出下一个结果:

但是当使用 Encoding.Unicode 时,控制台会给出一组无限的 smth,如下所示:

我究竟需要编写什么才能让我的 C# 代码识别并响应这些符号?

我用这个 unicode char finder 来找出字符是什么。

顺序是...

U+0003:文本结束 [ETX]

U+0001:标题开始 [SOH]