是否有专门用于识别列或行中重复网站的公式?
Is there formula specifically for identifying duplicate websites in a column or row?
我有一长串网站,需要一些方法来确定是否有任何重复的网站。
例如:
- https://www.forbes.com/leadership/#3364f19f1d66
- www.inc.com
- 福布斯com/sites/constancedierickx/2020/01/31/wework-and-the-charisma-proxy/#4175162f52c7
- https://www.inc.com/emily-canal/120-water-audit-clean-water-best-industries-2020.html?icid=hmsub1
google 工作表是否有某种添加或公式来检测此列表是否有重复项? (有 2 个 INC 页面,所以这是一对重复和 2 个福布斯页面,这是另一对重复)
使用:
=ARRAYFORMULA(IF(COUNTIF(IFERROR(IFNA(REGEXEXTRACT(INDEX(SPLIT(
REGEXREPLACE(A:A, "https?://www.|https?://|www.", ), "/"),,1),
"\.(.+\..+)"), INDEX(SPLIT(
REGEXREPLACE(A:A, "https?://www.|https?://|www.", ), "/"),,1))),
IFERROR(IFNA(REGEXEXTRACT(INDEX(SPLIT(
REGEXREPLACE(A:A, "https?://www.|https?://|www.", ), "/"),,1),
"\.(.+\..+)"), INDEX(SPLIT(
REGEXREPLACE(A:A, "https?://www.|https?://|www.", ), "/"),,1))))>1,
"Duplicate", ))
我有一长串网站,需要一些方法来确定是否有任何重复的网站。
例如:
- https://www.forbes.com/leadership/#3364f19f1d66
- www.inc.com
- 福布斯com/sites/constancedierickx/2020/01/31/wework-and-the-charisma-proxy/#4175162f52c7
- https://www.inc.com/emily-canal/120-water-audit-clean-water-best-industries-2020.html?icid=hmsub1
google 工作表是否有某种添加或公式来检测此列表是否有重复项? (有 2 个 INC 页面,所以这是一对重复和 2 个福布斯页面,这是另一对重复)
使用:
=ARRAYFORMULA(IF(COUNTIF(IFERROR(IFNA(REGEXEXTRACT(INDEX(SPLIT(
REGEXREPLACE(A:A, "https?://www.|https?://|www.", ), "/"),,1),
"\.(.+\..+)"), INDEX(SPLIT(
REGEXREPLACE(A:A, "https?://www.|https?://|www.", ), "/"),,1))),
IFERROR(IFNA(REGEXEXTRACT(INDEX(SPLIT(
REGEXREPLACE(A:A, "https?://www.|https?://|www.", ), "/"),,1),
"\.(.+\..+)"), INDEX(SPLIT(
REGEXREPLACE(A:A, "https?://www.|https?://|www.", ), "/"),,1))))>1,
"Duplicate", ))