从 char 到单个字符串的隐式转换

Implicit conversion from char to single character string

首先:我知道如何解决这个问题。我不是在寻找解决方案。我对导致某些隐式转换但没有导致其他设计选择背后的推理很感兴趣。

今天我在我们的代码库中遇到了一个小但有影响的错误,其中 int 常量被初始化为相同数字的 char 表示。这导致 charintASCII 转换。像这样:

char a = 'a';
int z = a;
Console.WriteLine(z);    
// Result: 97

我很困惑为什么 C# 会允许这样的事情。在四处搜索之后,我发现了以下 SO 问题以及 Eric Lippert 自己的回答:Implicit Type cast in C#

节选:

However, we can make educated guesses as to why implicit char-to-ushort was considered a good idea. The key idea here is that the conversion from number to character is a "possibly dodgy" conversion. It's taking something that you do not KNOW is intended to be a character, and choosing to treat it as one. That seems like the sort of thing you want to call out that you are doing explicitly, rather than accidentally allowing it. But the reverse is much less dodgy. There is a long tradition in C programming of treating characters as integers -- to obtain their underlying values, or to do mathematics on them.

我同意其背后的推理,尽管 IDE 提示会很棒。但是,我还有另一种情况,隐式转换突然 合法:

char a = 'a';
string z = a; // CS0029 Cannot implicitly convert type 'char' to 'string'

这个转换依我愚见,非常合乎逻辑。不会导致数据丢失,作者的意图也很明确。此外,在我阅读了 charint 隐式转换的其余答案后,我仍然看不出有任何理由说明这不合法。

所以这引出了我的实际问题:

C# 设计团队有什么理由不实现从 charstring 的隐式转换,虽然它看起来很明显(尤其是与charint 的转换)。

因为当您将 char 转换为 int 时,您不仅在更改其类型,而且还在 ASCII table 中获取其索引是完全不同的事情,他们不会让您 "convert a char to an int" 他们会为您提供可能需要的有用数据。

为什么不让 char 转换为 string

因为它们实际上代表了很多不同的东西,并且以非常不同的方式存储。

字符和字符串不是表达同一事物的两种方式。

Char 是值类型。不,它不是像 int 或 double 这样的数字,但它仍然来自 System.ValueType。然后一个 char 变量存在于堆栈中。

String 是引用类型。所以它住在堆上。如果要将值类型用作引用类型,则需要先将其装箱。编译器需要确保您通过装箱知道自己在做什么。因此,您不能进行隐式转换。

首先,当有人问 "why not?" 关于 C# 的问题时,我总是说:设计团队不必提供 功能的理由.功能需要花费时间、精力和金钱,而您所做的每项功能都需要花费时间、精力和金钱,而不是 更好的 功能。

但我不想立即拒绝这个前提;这个问题最好表述为 "what are design pros and cons of this proposed feature?"

这是一个完全合理的功能,有些语言允许您将单个字符视为字符串。 (蒂姆在评论中提到 VB,Python 也将字符和单字符字符串视为可互换的 IIRC。我敢肯定还有其他的。)但是,如果我推销这个功能,我会指出一些缺点:

  • 这是一种新的拳击转换形式。字符是便宜的值类型。字符串是堆分配的引用类型。装箱转换会导致性能问题并产生收集压力,因此有人认为它们应该在程序中更明显,而不是更不明显。
  • 该功能不会被视为 "chars are convertible to one-character strings"。用户会将其视为 "chars are one-character strings",现在提出许多连锁问题是完全合理的,例如:可以在 char 上调用 .Length 吗?如果我可以将 char 传递给需要 string 的方法,并且可以将字符串传递给需要 IEnumerable<char> 的方法,我可以将 char 传递给需要 IEnumerable<char> 的方法吗一个 IEnumerable<char>?这似乎……很奇怪。我可以在字符串上调用 SelectWhere;我可以在 char 上吗?这似乎更奇怪。所有提议的功能都是移动你的问题;如果已经实施,您现在会问 "why can't I call Select on a char?" 或类似的问题。

  • 现在把前面两点结合起来。如果我将 char 视为单字符字符串,并将 char 转换为对象,我得到的是盒装 char 还是字符串?

  • 我们还可以进一步概括第二点。字符串是字符的集合。如果我们要说一个 char 可以转换为一个 char 的集合,为什么只说字符串呢?为什么不说 char 也可以用作 List<char>?为什么停止 char?我们应该说 int 可以转换为 IEnumerable<int> 吗?
  • 我们可以进一步概括:如果存在从 char 到 sequence-of-chars-in-a-string 的明显转换,那么也存在从 char 到 Task<char> 的明显转换——只需创建returns char 和 Func<char> 完成的任务只需创建一个 lambda returns char - Lazy<char>Nullable<char> -- 哦,等等,我们 允许转换为 Nullable<char>。 :-)

这些问题都是可以解决的,有些语言已经解决了。那不是问题。问题是:所有这些问题都是语言设计团队必须识别、讨论和解决的问题。语言设计中的一个基本问题是 这个特性应该有多通用? 在两分钟内我就从 "chars are convertible to single-character strings" 变成了 "any value of an underlying type is convertible to an equivalent value of a monadic type"。对于这两个特征以及普遍性范围内的各种其他点,都存在争议。如果你让你的语言特性过于具体,它就会变成一大堆相互之间交互性很差的特例。如果你把它们说得太笼统,好吧,我猜你有 Haskell。 :-)

假设设计团队得出关于该功能的结论:所有这些都必须写在设计文档和规范中,并且必须编写代码和测试,哦,我有没有提到任何时候您更改可转换性规则时,某人的重载解决方案代码都会中断?可转换性规则在第一个版本中确实必须正确,因为以后更改它们会使现有代码更加脆弱。如果您在第 8 版而不是第 1 版中进行此类更改,则会产生实际的设计成本,并且实际用户也会付出实际成本。

现在比较这些不利因素——我确信还有更多我没有列出的不利因素——与有利因素。好处非常小:您可以避免调用 ToString+ "" 或任何将 char 显式转换为字符串的操作。

这甚至不足以证明设计、实施、测试和向后兼容破坏成本的合理性。

就像我说的,这是一个合理的特性,如果它出现在该语言的第 1 版中——没有泛型,或者安装了数十亿行代码的基础——那么它就会是一个更容易卖。但是现在,有很多功能可以以更小的成本获得更大的收益。