从 URL 中提取 HTTP 查询参数的 PostgreSQL 函数
PostgreSQL function to extract a HTTP query argument from a URL
我想从表示 URL 的字符串中提取查询参数,并且我想在存储函数中执行此操作(我无法使用某些标准函数?).
在 Python 中,这将是:
from urlparse import urlparse, parse_qs
def extract_oid(url):
"""
extract the 'oid' query argument
(simplified, no error handling)
>>> extract_oid('http://some.host/some/path?oid=abc123&other')
'abc123'
"""
return parse_qs(urlparse(url).query)['oid'][0]
我目前在 plpgsql
中的尝试是:
CREATE OR REPLACE FUNCTION extract_oid (link text)
RETURNS text
AS $$
DECLARE
pos1 integer := position('&oid=' in link);
tail text := substring(link from pos1 + 1);
endpos integer := position('&' in tail);
BEGIN
if link is NULL or pos1 = 0 then
RETURN NULL;
ELSIF endpos = 0 then
RETURN substring(tail from 5);
ELSE
RETURN substring(tail from 5 for endpos - 1);
END IF;
END;
$$ LANGUAGE plpgsql;
如果 oid
是查询字符串中的最后一个参数并且至少有一个前导参数(否则我也需要识别 ?oid=
);但是,当后面有另一个 &
时,它会失败。我想在这里安全......
endpos
变量似乎有问题。
有人能赐教吗?谢谢!
我需要它来使用 PostgreSQL 9.3+。
编辑:
我发现我的逻辑错误(当然我需要减去5而不是1,傻我),但是在马的回答之后,我的函数看起来像这样:
CREATE OR REPLACE FUNCTION extract_oid (url text)
RETURNS text
AS $$
BEGIN
RETURN split_part(substring(url from '[?&]oid=[^&]+'), '=', 2);
END;
$$ LANGUAGE plpgsql;
除了在 Python function 中使用您的 Python 代码外,我会为此使用正则表达式:
split_part(substring(link from 'oid=\w+'), '=', 2)
substring(link from 'oid=\w+')
将 return oid=abc123
和 split_part()
然后使用 =
作为分隔符提取第二个元素。
with t (url) as (
values
('http://some.host/some/path?oid=abc123&other'),
('http://some.host/some/path?other&oid=def456&foo=bar')
)
select split_part(substring(url from 'oid=\w+'), '=', 2)
from t;
将return:
split_part
----------
abc123
def456
我认为这也适用于 9.3
我想从表示 URL 的字符串中提取查询参数,并且我想在存储函数中执行此操作(我无法使用某些标准函数?).
在 Python 中,这将是:
from urlparse import urlparse, parse_qs
def extract_oid(url):
"""
extract the 'oid' query argument
(simplified, no error handling)
>>> extract_oid('http://some.host/some/path?oid=abc123&other')
'abc123'
"""
return parse_qs(urlparse(url).query)['oid'][0]
我目前在 plpgsql
中的尝试是:
CREATE OR REPLACE FUNCTION extract_oid (link text)
RETURNS text
AS $$
DECLARE
pos1 integer := position('&oid=' in link);
tail text := substring(link from pos1 + 1);
endpos integer := position('&' in tail);
BEGIN
if link is NULL or pos1 = 0 then
RETURN NULL;
ELSIF endpos = 0 then
RETURN substring(tail from 5);
ELSE
RETURN substring(tail from 5 for endpos - 1);
END IF;
END;
$$ LANGUAGE plpgsql;
如果 oid
是查询字符串中的最后一个参数并且至少有一个前导参数(否则我也需要识别 ?oid=
);但是,当后面有另一个 &
时,它会失败。我想在这里安全......
endpos
变量似乎有问题。
有人能赐教吗?谢谢!
我需要它来使用 PostgreSQL 9.3+。
编辑:
我发现我的逻辑错误(当然我需要减去5而不是1,傻我),但是在马的回答之后,我的函数看起来像这样:
CREATE OR REPLACE FUNCTION extract_oid (url text)
RETURNS text
AS $$
BEGIN
RETURN split_part(substring(url from '[?&]oid=[^&]+'), '=', 2);
END;
$$ LANGUAGE plpgsql;
除了在 Python function 中使用您的 Python 代码外,我会为此使用正则表达式:
split_part(substring(link from 'oid=\w+'), '=', 2)
substring(link from 'oid=\w+')
将 return oid=abc123
和 split_part()
然后使用 =
作为分隔符提取第二个元素。
with t (url) as (
values
('http://some.host/some/path?oid=abc123&other'),
('http://some.host/some/path?other&oid=def456&foo=bar')
)
select split_part(substring(url from 'oid=\w+'), '=', 2)
from t;
将return:
split_part
----------
abc123
def456
我认为这也适用于 9.3