excel 是否有一种快速的方法来识别和删除像这样的单元格中的重复系列?
Is there a quick way for excel to identify and remove duplicate series from a cell such as this?
是否有内置函数或简单的 UDF 可以识别以下信息中的模式并删除重复项?
假设以下内容都在一个 excel 单元格中:
80154, 80299, 80299, 82055, 82145, 82205, 82520, 82570, 83840, 83925,
83925, 83986, 83992, 84315, 80154, 80299, 80299, 82055, 82145, 82205,
82520, 82570, 83840, 83925, 83925, 83986, 83992, 84315
有两组数据(80154开头,84315结尾)。我只想以一套结束,但我想做到 50,000 行。最终输出应该只是粗体文本。另外,有时数据会重复3次,同样,我只想要唯一的一组数据。
注意:我不能只删除重复项,因为有时我需要在最终输出中捕获的集合中有重复项。例如,(A,A,B,C,A,A,B,C) 需要简化为 (A,A,B,C)。
这会找到前 20% 重复的位置并在该点剪切字符串。
如果没有找到重复项,它将 return 整个字符串。
=IFERROR(LEFT(A1,FIND(LEFT(A1,LEN(A1)/5),A1,2)-3),A1)
玩 5
直到找到合适的字符串长度,这将使您在所有字符串上都得到正确答案。数字越大,它比较的字符串越小。
另外,如果剪得太多或不够,比如把,
留在最后,上下调整-3
。
是否有内置函数或简单的 UDF 可以识别以下信息中的模式并删除重复项?
假设以下内容都在一个 excel 单元格中:
80154, 80299, 80299, 82055, 82145, 82205, 82520, 82570, 83840, 83925, 83925, 83986, 83992, 84315, 80154, 80299, 80299, 82055, 82145, 82205, 82520, 82570, 83840, 83925, 83925, 83986, 83992, 84315
有两组数据(80154开头,84315结尾)。我只想以一套结束,但我想做到 50,000 行。最终输出应该只是粗体文本。另外,有时数据会重复3次,同样,我只想要唯一的一组数据。
注意:我不能只删除重复项,因为有时我需要在最终输出中捕获的集合中有重复项。例如,(A,A,B,C,A,A,B,C) 需要简化为 (A,A,B,C)。
这会找到前 20% 重复的位置并在该点剪切字符串。
如果没有找到重复项,它将 return 整个字符串。
=IFERROR(LEFT(A1,FIND(LEFT(A1,LEN(A1)/5),A1,2)-3),A1)
玩 5
直到找到合适的字符串长度,这将使您在所有字符串上都得到正确答案。数字越大,它比较的字符串越小。
另外,如果剪得太多或不够,比如把,
留在最后,上下调整-3
。