url 路径提取的正则表达式
Regex for extract for url path
我需要帮助为 PostgresSQL 创建正则表达式以提取特定的 url 路径并将它们放入单独的列中。
比如我需要提取以下网址
https://example.com/drinks/
https://example.com/drinks/beverages/
https://example.com/drinks/beverages/pepsi/pepsi-can-16-oz/
Column 1 | Column 2
---------------------------------------------------------------------------------------
https://example.com/drinks | /drinks/
https://example.com/drinks/beverages | /drinks/beverage/
https://example.com/drinks/beverages/pepsi/pepsi-can-16-oz | /drinks/beverages/pepsi/
最后,在 /drinks/beverage/*
...
之后获取任何内容的正则表达式
正则表达式不是我的强项,所以我正在寻找一些关于如何实现这一点的指导。
试试这个...
(?=((?i)http(s)?:\/\/(?:[\w0-9](?:[\w0-9-]{0,61}[\w0-9])?\.)+[\w0-9][\w0-9-]{0,61}[\w0-9])).*
本质上它将匹配域(即 https://example.com),然后提前查找以获取适合您的路径。
我需要帮助为 PostgresSQL 创建正则表达式以提取特定的 url 路径并将它们放入单独的列中。
比如我需要提取以下网址
https://example.com/drinks/
https://example.com/drinks/beverages/
https://example.com/drinks/beverages/pepsi/pepsi-can-16-oz/
Column 1 | Column 2
---------------------------------------------------------------------------------------
https://example.com/drinks | /drinks/
https://example.com/drinks/beverages | /drinks/beverage/
https://example.com/drinks/beverages/pepsi/pepsi-can-16-oz | /drinks/beverages/pepsi/
最后,在 /drinks/beverage/*
...
正则表达式不是我的强项,所以我正在寻找一些关于如何实现这一点的指导。
试试这个...
(?=((?i)http(s)?:\/\/(?:[\w0-9](?:[\w0-9-]{0,61}[\w0-9])?\.)+[\w0-9][\w0-9-]{0,61}[\w0-9])).*
本质上它将匹配域(即 https://example.com),然后提前查找以获取适合您的路径。