如何衡量代码库中的冗余?
How to measure redundancy in code bases?
我继承了一个中等规模的代码库,其唯一的编程范例似乎是复制和粘贴。实际上有几十个代码片段可以很容易地参数化并用一个简单的函数调用替换。该代码不是关键任务,因为它是 "only" 测试代码。然而,这使得合并更改变得很痛苦。
- 是否有衡量冗余量的指标(在研究中)?
- 如何计算它们的值?
想到的朴素方法:
- 查看代码的压缩程度。
- 成对
diff
所有文件并计算相同或相似的行数。类似于:只有一个字不同。
我继承了一个中等规模的代码库,其唯一的编程范例似乎是复制和粘贴。实际上有几十个代码片段可以很容易地参数化并用一个简单的函数调用替换。该代码不是关键任务,因为它是 "only" 测试代码。然而,这使得合并更改变得很痛苦。
- 是否有衡量冗余量的指标(在研究中)?
- 如何计算它们的值?
想到的朴素方法:
- 查看代码的压缩程度。
- 成对
diff
所有文件并计算相同或相似的行数。类似于:只有一个字不同。