如何根据字符变量的一部分合并两个数据框?

How to merge two data frames based on part of a character variable?

我需要合并两个数据集。第一个数据集是我正在使用的原始数据集,第二个数据集是我需要添加的数据。我会根据公司名称合并它们,因为该字符变量在两个数据集中,但它们的呈现方式不同(例如,“Apple Inc.”在一个数据框中,“Apple”在另一个数据框中)所以我不能只是像我一样使用 merge()

我认为最好的方法是尝试根据这些变量的第一个 x 个共同字母来合并它们,但我不知道该怎么做,也不知道这是否是最好的解决这个问题的方法。

谁能帮我解决这个问题?我使用 R 才几个月,没有编程背景,所以这些东西对我来说不是很自然。

一个简单的解决方法是添加一个仅包含子字符串的列并将其用于合并:

x$merge.col <- substr(x$company.name, 1, 5)
y$merge.col <- substr(y$company.name, 1, 5)
z <- merge(x, y, by="merge.col")