从字符串中删除特定字符以整理 URL

Remove specific characters from string to tidy up URLs

您好,我正在尝试清理 Google 表格中的一列混乱的 URL 链接,我希望所有格式的网站链接都相同,这样我就可以 运行 对它们进行重复检查。

例如,我有一个包含各种 http、http://、https:// 等的 URL 列表。我正在尝试使用 REGEXREPLACE 工具从列条目,但无法使其正常工作。这是我的:

之前:

http://www.website1.com/

https://website2.com/

https://www.website3.com/

我想要 - 之后:

website.com

website2.com

website3.com

如果这发生在多个公式上并因此产生最终结果的列,那没关系。

尝试:

=ARRAYFORMULA(IFERROR(REGEXEXTRACT(INDEX(SPLIT(
 REGEXREPLACE(A1:A, "https?://www.|https?://|www.", ), "/"),,1), 
 "\.(.+\..+)"), INDEX(IFERROR(SPLIT(
 REGEXREPLACE(A1:A, "https?://www.|https?://|www.", ), "/")),,1)))


或更短:

=INDEX(IFERROR(REGEXEXTRACT(A1:A, "^(?:https?:\/\/)?(?:www\.)?([^\/]+)")))

你可以试试下面的公式

=ArrayFormula(regexreplace(LEFT(P1:P3,LEN(P1:P3)-1),"(.*//www.)|(.*//)",""))

请根据需要调整范围。