在 C# 中检查一个字符串是半角还是全角
Check if a string is half width or full width in C#
C# application on Japanese Windows OS - Present Latin as Full-Width characters
我在上面提到了接受的答案 link 并使用下面的代码将日语字符串从全角转换为半角,但它返回相同的全角字符串而不进行转换。
string userInput = "チヨチヨチチヨチヨチ";
string result = userInput.Normalize(NormalizationForm.FormKC);
预期半宽输出:チヨチヨチチヨチヨチ
实际输出:チヨチヨチヨチヨチ(全角)
然而,即使上面的代码应该将全角字符串转换为半角,当我将半角字符串 (チヨチヨチチヨチヨチ) 传递给上面的代码时,它会将其转换为全角形式 (チヨチヨチヨチヨチ).
我在这里做错了什么?
无论如何,如果我的字符串已经是半角,我不想执行上面的代码。
如何检查字符串是半角还是全角?
根据 this 文档,规范化方法按预期工作。它必须将字符转换为标准字符,以便正确应用二进制比较。
但是如果您想要一个始终将 full-width 转换为 half-width 的自定义转换,您可以创建一个 Dictionary to map full-width to half-width characters. This link 可能有助于创建此映射。
如果你想确定字符串在 half-width 中,那么如果它包含任何 full-width 字符,它就会被拒绝。创建一个包含所有 full-width 个字符(拉丁文和日文)的字符串,然后在 full-width 个字符的字符串中找到要测试的字符串的所有字符。
我为此编写了 isHalfWidthString
方法,并将 full-width 添加到 half-width 转换器方法。我认为这可能有帮助:
public class FullWidthCharactersHandler
{
static Dictionary<char, char> fullWidth2halfWidthDic;
static FullWidthCharactersHandler()
{
fullWidth2halfWidthDic = new Dictionary<char, char>();
string fullWidthChars = "アイウエオカキクケコサシスセソタチツテトナニヌネノハヒフヘホマミムメモヤユヨラリルレロワヲンッァィゥェォャュョ゙゚ー0123456789ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz";
string halfWidthChars = "アイウエオカキクケコサシスセソタチツテトナニヌネノハヒフヘホマミムメモヤユヨラリルレロワヲンッァィゥェォャュョ゙゚ー0123456789ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz";
for (int i = 0; i < fullWidthChars.Length; i++)
{
fullWidth2halfWidthDic.Add(fullWidthChars[i], halfWidthChars[i]);
}
}
public static bool isHalfWidthString(string toTestString)
{
bool isHalfWidth = true;
foreach (char ch in toTestString)
{
if (fullWidth2halfWidthDic.ContainsKey(ch))
{
isHalfWidth = false;
break;
}
}
return isHalfWidth;
}
public static string convertFullWidthToHalfWidth(string theString)
{
StringBuilder sbResult = new StringBuilder(theString);
for (int i = 0; i < theString.Length; i++)
{
if (fullWidth2halfWidthDic.ContainsKey(theString[i]))
{
sbResult[i] = fullWidth2halfWidthDic[theString[i]];
}
}
return sbResult.ToString();
}
}
测试用 this link.
我更新了代码以使用 Dictionary
以获得更好的性能。
C# application on Japanese Windows OS - Present Latin as Full-Width characters
我在上面提到了接受的答案 link 并使用下面的代码将日语字符串从全角转换为半角,但它返回相同的全角字符串而不进行转换。
string userInput = "チヨチヨチチヨチヨチ";
string result = userInput.Normalize(NormalizationForm.FormKC);
预期半宽输出:チヨチヨチチヨチヨチ 实际输出:チヨチヨチヨチヨチ(全角)
然而,即使上面的代码应该将全角字符串转换为半角,当我将半角字符串 (チヨチヨチチヨチヨチ) 传递给上面的代码时,它会将其转换为全角形式 (チヨチヨチヨチヨチ).
我在这里做错了什么?
无论如何,如果我的字符串已经是半角,我不想执行上面的代码。
如何检查字符串是半角还是全角?
根据 this 文档,规范化方法按预期工作。它必须将字符转换为标准字符,以便正确应用二进制比较。
但是如果您想要一个始终将 full-width 转换为 half-width 的自定义转换,您可以创建一个 Dictionary to map full-width to half-width characters. This link 可能有助于创建此映射。
如果你想确定字符串在 half-width 中,那么如果它包含任何 full-width 字符,它就会被拒绝。创建一个包含所有 full-width 个字符(拉丁文和日文)的字符串,然后在 full-width 个字符的字符串中找到要测试的字符串的所有字符。
我为此编写了 isHalfWidthString
方法,并将 full-width 添加到 half-width 转换器方法。我认为这可能有帮助:
public class FullWidthCharactersHandler
{
static Dictionary<char, char> fullWidth2halfWidthDic;
static FullWidthCharactersHandler()
{
fullWidth2halfWidthDic = new Dictionary<char, char>();
string fullWidthChars = "アイウエオカキクケコサシスセソタチツテトナニヌネノハヒフヘホマミムメモヤユヨラリルレロワヲンッァィゥェォャュョ゙゚ー0123456789ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz";
string halfWidthChars = "アイウエオカキクケコサシスセソタチツテトナニヌネノハヒフヘホマミムメモヤユヨラリルレロワヲンッァィゥェォャュョ゙゚ー0123456789ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz";
for (int i = 0; i < fullWidthChars.Length; i++)
{
fullWidth2halfWidthDic.Add(fullWidthChars[i], halfWidthChars[i]);
}
}
public static bool isHalfWidthString(string toTestString)
{
bool isHalfWidth = true;
foreach (char ch in toTestString)
{
if (fullWidth2halfWidthDic.ContainsKey(ch))
{
isHalfWidth = false;
break;
}
}
return isHalfWidth;
}
public static string convertFullWidthToHalfWidth(string theString)
{
StringBuilder sbResult = new StringBuilder(theString);
for (int i = 0; i < theString.Length; i++)
{
if (fullWidth2halfWidthDic.ContainsKey(theString[i]))
{
sbResult[i] = fullWidth2halfWidthDic[theString[i]];
}
}
return sbResult.ToString();
}
}
测试用 this link.
我更新了代码以使用 Dictionary
以获得更好的性能。