正则表达式将 IP:Port 从日志中分离出来

Regex separate IP:Port from a log

我有以下简单的正则表达式,可以很好地拆分给定的示例日志。这将提供单独的对象组,我可以使用 $1 $2 $3 ... 等访问这些对象。我在 Splunk 中使用它。

例如

 = https
 = 2020-08-20T12:40:00.274478Z
 = app/my-aws-alb/e7538073dd1a6fd8

(.*?\s+)(.*?\s+)(.*?\s+)(.*?\s+?)(.*?\s+)(.*?\s+)(.*?\s+)(.*?\s+)(.*?\s+)(.*?\s+)(.*?\s+)(.*?\s+)(.*?\s+)(.*?\s+)(.*?\s+)(.*?\s+)(.*?\s+)(.*?\s+)(.*?\s+)(.*?\s+)(.*?\s+)(.*?\s+)(.*?\s+)(.*?\s+)(.*?\s+)(.*?\s+)(.*?\s+)(.*?\s+)(.*?\s+)(.*?\s+)

https 2020-08-20T12:40:00.274478Z app/my-aws-alb/e7538073dd1a6fd8 162.158.26.188:21098 172.0.51.37:80 0.000 0.004 0.000 405 405 974 424 "POST https://my-aws-alb-domain:443/api/ps/fpx/callback HTTP/1.1" "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/32.0.2840.91 Safari/537.36" ECDHE-RSA-AES128-GCM-SHA256 TLSv1.2 arn:aws:elasticloadbalancing:ap-southeast-1:111111111111:targetgroup/my-aws-target-group/41dbd234b301e3d84 "Root=1-5f3e6f20-3fdasdsfffdsf" "api.mydomain.com" "arn:aws:acm:ap-southeast-1:11111111111:certificate/be4344424-a40f-416e-8434c-88a8a3b072f5" 0 2020-08-20T12:40:00.270000Z "forward" "-" "-" "172.0.51.37:80" "405" "-" "-"

这里的问题是,我想将 IP:Port 分成单独的组。有多个地方有 IP:Port。我需要的那些像其他对象一样作为一个单独的组。

例如

 = 162.158.26.188
 = 21098 
 = 172.0.51.37
 = 80

有人可以帮忙吗?谢谢!

这是一个正则表达式,将从字段中提取所有 ip:port 值:

| rex field=_raw max_match=0 "(?<ip_port>\d+\.\d+\.\d+\.\d+\:\d+)"

现在展开 ip_port 字段:

| mvexpand ip_port

然后从ip_port提取到ip & port:

| rex field=ip_port "(?<ip>\d+\.\d+\.\d+\.\d+\)\:(?<port>\d+)"