C: 何时按值 return 或传递引用

C: When to return by value or pass reference

虽然这个话题已经讨论过很多次了,但是至今我还没有找到满意的答案。何时通过 return 从函数中获取 return 数据或传递 reference 以更改地址上的数据?经典的答案是当变量变大时将变量作为函数的引用传递(以避免堆栈复制)。对于结构或数组之类的任何东西,这看起来都是正确的。但是 return 从函数中获取指针并不少见。事实上,C 库中的某些函数与此完全相同。例如:

char *strcat(char *dst, const char *src);

始终return指向目标的指针,即使出现错误也是如此。在这种情况下,我们可以只使用传递的变量并保留 return 原样(就像大多数人所做的那样)。

在查看结构时,我发现同样的事情正在发生。我经常return指针时函数只有需要用于变量初始化

char *p = func(int i, const char *s);

然后有一个论点,即堆栈应对变量很昂贵,因此改用指针。但是如前所述 here 一些编译器能够自己决定这一点(假设这也适用于 C)。是否有一般规则,或者至少有一些不成文的约定何时使用其中一个或另一个?我重视性能高于设计。

经验法则:

  1. 如果 sizeof(return type) 大于 sizeof(int),您可能应该通过指针传递它以避免复制开销。这是一个性能问题。取消引用指针会受到一些惩罚,因此此规则有一些例外情况。
  2. 如果return类型是复杂的(包含指针成员),则通过指针传递。将本地return值复制到栈中不会复制动态内存,例如
  3. 如果你想让函数分配内存,它应该return一个指向新分配内存的指针。它被称为 factory 设计模式。
  4. 如果您想要从一个函数中 return 不止一件事 - return 一个按值,然后通过指针传递其余部分。
  5. 如果你有一个既是输入又是输出的complex/big数据类型,通过指针传递它。

首先确定哪种方法在 逻辑 级别最有意义,而不管您认为性能影响可能是什么。如果 returning a struct 按值最清楚地传达了代码的 intent,那么就这样做。

现在已经不是 1980 年代了。从那时起,编译器变得更加聪明,并且在优化代码方面做得非常好,尤其是那些以清晰、直接的方式编写的代码。同样,参数传递和值 return 约定也变得相当复杂。简单的基于堆栈的模型并不能真正反映现代硬件的现实。

如果生成的应用程序不符合您的性能标准,那么 运行 它会通过分析器找到瓶颈。如果事实证明 returning struct 按值导致问题,然后 您可以尝试通过引用传递函数。

除非您在高度受限的嵌入式环境中工作,否则您真的不必计算每个字节和 CPU 周期。您不想不必要地浪费,但出于同样的原因,您不想沉迷于低级别的工作方式,除非 a) 您有非常严格的性能要求并且 b) 您是 亲密的 熟悉您的特定平台的详细信息(这意味着您不仅了解您平台的函数调用约定的里里外外,您还知道您的编译器如何使用这些约定)。否则,你只是在猜测。让编译器为您完成艰苦的工作。这就是它的用途。