C# - 如何替换重音字符,即“-É”与“-É”

C# - How to replace accented characters, i.e., "-É" with "- É"

我正在制作一个非常简单的 Windows 应用程序,它使用 Visual Studio 和 C# 来编辑电影的字幕文件。我想要一个程序,可以在没有对话句子时向对话句子添加 space。例如:

-嘿,怎么了?

-没什么。

- 嘿,怎么了?

- 没什么。

我使用工具箱创建了一个界面,只需一个按钮即可选择正确的文件。这是我为这个按钮准备的代码:

private void button1_Click(object sender, EventArgs e)
    {
        if (openFileDialog1.ShowDialog() == DialogResult.OK)
        {
            string text = File.ReadAllText(openFileDialog1.FileName, Encoding.GetEncoding("iso-8859-1"));
            text = text.Replace("-A", "- A");
            File.WriteAllText(openFileDialog1.FileName, text, Encoding.GetEncoding("iso-8859-1"));
        }
    }

这基本上是将“-A”替换为“-A”,从而创建 space。这是我想出的解决方案,我计划对每个字母都这样做,包括 重音字母,例如 À、Á、È、É 等。

这不起作用。如果我输入 text = text.Replace("-É", "-É"); 程序什么都不做。

我想知道的是如何解决这个问题。

感谢您的阅读,如果您对我的申请有更好的选择,请随时告诉我。

至于注释,使用正则表达式。

        var rx = new System.Text.RegularExpressions.Regex("^-([^ ])");
        ... in your loop
        var text = rx.Replace(text, "- ");

基本上,它的作用是搜索字符串开头的破折号,但只有破折号后面没有 space。 () 表示破折号后的字符应为 "saved"。 替换在提供的字符串中搜索并用破折号、space 和之前匹配的相同字符替换 (doh!) 匹配的文本。不管是什么。

来源:https://xkcd.com/208/

编辑:你没有循环,你有一个包含文件全部内容的字符串,其中每一行都应该包含一个副标题行(对吗?)。 如果是这种情况,您可以将正则表达式配置为将字符串视为行列表,如下所示:

        var rx = new Regex("^-([^ ])", RegexOptions.Multiline);

查看此 fiddle 示例: https://dotnetfiddle.net/ciFlAu

对于重音字符,考虑使用其 Unicode 表示:

string text = "-\u00C9"; //-É
text = text.Replace("-\u00C9", "- \u00C9"));

您也可以使用不间断 space 来替换 space,以防万一:

string text = "-\u00C9";
text = text.Replace("-\u00C9", "-\u00A0\u00C9"));

然后你可以使用UTF-8/UTF-16编码:

File.WriteAllText(openFileDialog1.FileName, text, Encoding.GetEncoding("UTF-8"));