为什么模式匹配性能并不比 elixir 中的 ifelse/cond 好多少?
why pattern matching performance is not much better than ifelse/cond in elixir?
我听说 erlang beam 通过模式匹配调优很多,因此性能比条件表达式好得多。我在 elixir 中做了一个测试,运行 用 benchfella 进行了基准测试。但是,我发现模式匹配性能与 if/cond 相比几乎是同一水平的性能。
$ mix bench -d 10
Settings:
duration: 10.0 s
mem stats: false
sys mem stats: false
[12:30:08] 1/3: PatternMatchBench.if else performance
[12:30:28] 2/3: PatternMatchBench.cond performance
[12:30:47] 3/3: PatternMatchBench.pattern match performance
Finished in 57.5 seconds
PatternMatchBench.if else performance: 10000 1723.24 µs/op
PatternMatchBench.cond performance: 10000 1723.36 µs/op
PatternMatchBench.pattern match performance: 10000 1726.95 µs/op
下面是核心代码,主要是在不同情况下将数据格式化为字符串。整个项目可以通过https://github.com/tyrchen/pattern_match.
获得
defmodule Ifelse do
def process(data) do
if is_list(data) do
data
|> Enum.map(fn(entry) ->
if is_tuple(entry) do
{k,v} = entry
"#{k}: #{v}" |> transform
else
entry |> process
end
end)
|> Enum.join("\n")
else
if is_map(data) do
data
|> Enum.map(fn({k, v}) -> transform("#{k}: #{v}") end)
|> Enum.join("\n")
else
data |> transform
end
end
end
defp transform(str) do
" #{str}"
end
end
defmodule Cond do
def process(data) do
cond do
is_list(data) ->
data
|> Enum.map(fn(item) ->
cond do
is_tuple(item) ->
{k, v} = item
"#{k}: #{v}" |> transform
true ->
item |> process
end
end)
|> Enum.join("\n")
is_map(data) ->
data
|> Enum.map(fn({k, v}) -> "#{k}: #{v}" |> transform end)
|> Enum.join("\n")
true ->
" #{data}"
end
end
defp transform(str) do
" #{str}"
end
end
defmodule Pattern do
def process(data) when is_tuple(data) do
{k, v} = data
"#{k}: #{v}" |> process
end
def process(data) when is_list(data) or is_map(data) do
data
|> Enum.map(fn(entry) -> process(entry) end)
|> Enum.join("\n")
end
def process(data) do
" #{data}"
end
end
我错过了什么吗?或者我需要更复杂的测试来找出 erlang VM 模式匹配的强度?
两点:
为了让您看到任何好处,您需要进行大量测试,因为归根结底,条件检查是线性的 (O(N)
) 而模式可以优化为二叉树搜索 (O(log2N)
)
尽管如此,并非所有模式都可以同样优化。如果我没记错的话,guard clauses还是线性匹配的
Elixir 用于 Unicode 操作的模式是肯定会启动模式优化的一个更直接的示例:
case codepoint do
?á -> ?Á
?é -> ?É
?í -> ?Í
...
?ū -> ?Ū
end
在这种情况下,VM 能够构建一棵树,而不是线性测试每个模式直到找到匹配的模式,二叉树将进行更快的查找。
Erlang VM 也可能能够优化列表和元组内部的模式。鉴于模式匹配通常更具表现力,事实上它平均更快并且仅在最坏情况下是线性的,这是一个非常好的加分项。
我听说 erlang beam 通过模式匹配调优很多,因此性能比条件表达式好得多。我在 elixir 中做了一个测试,运行 用 benchfella 进行了基准测试。但是,我发现模式匹配性能与 if/cond 相比几乎是同一水平的性能。
$ mix bench -d 10
Settings:
duration: 10.0 s
mem stats: false
sys mem stats: false
[12:30:08] 1/3: PatternMatchBench.if else performance
[12:30:28] 2/3: PatternMatchBench.cond performance
[12:30:47] 3/3: PatternMatchBench.pattern match performance
Finished in 57.5 seconds
PatternMatchBench.if else performance: 10000 1723.24 µs/op
PatternMatchBench.cond performance: 10000 1723.36 µs/op
PatternMatchBench.pattern match performance: 10000 1726.95 µs/op
下面是核心代码,主要是在不同情况下将数据格式化为字符串。整个项目可以通过https://github.com/tyrchen/pattern_match.
获得defmodule Ifelse do
def process(data) do
if is_list(data) do
data
|> Enum.map(fn(entry) ->
if is_tuple(entry) do
{k,v} = entry
"#{k}: #{v}" |> transform
else
entry |> process
end
end)
|> Enum.join("\n")
else
if is_map(data) do
data
|> Enum.map(fn({k, v}) -> transform("#{k}: #{v}") end)
|> Enum.join("\n")
else
data |> transform
end
end
end
defp transform(str) do
" #{str}"
end
end
defmodule Cond do
def process(data) do
cond do
is_list(data) ->
data
|> Enum.map(fn(item) ->
cond do
is_tuple(item) ->
{k, v} = item
"#{k}: #{v}" |> transform
true ->
item |> process
end
end)
|> Enum.join("\n")
is_map(data) ->
data
|> Enum.map(fn({k, v}) -> "#{k}: #{v}" |> transform end)
|> Enum.join("\n")
true ->
" #{data}"
end
end
defp transform(str) do
" #{str}"
end
end
defmodule Pattern do
def process(data) when is_tuple(data) do
{k, v} = data
"#{k}: #{v}" |> process
end
def process(data) when is_list(data) or is_map(data) do
data
|> Enum.map(fn(entry) -> process(entry) end)
|> Enum.join("\n")
end
def process(data) do
" #{data}"
end
end
我错过了什么吗?或者我需要更复杂的测试来找出 erlang VM 模式匹配的强度?
两点:
为了让您看到任何好处,您需要进行大量测试,因为归根结底,条件检查是线性的 (
O(N)
) 而模式可以优化为二叉树搜索 (O(log2N)
)尽管如此,并非所有模式都可以同样优化。如果我没记错的话,guard clauses还是线性匹配的
Elixir 用于 Unicode 操作的模式是肯定会启动模式优化的一个更直接的示例:
case codepoint do
?á -> ?Á
?é -> ?É
?í -> ?Í
...
?ū -> ?Ū
end
在这种情况下,VM 能够构建一棵树,而不是线性测试每个模式直到找到匹配的模式,二叉树将进行更快的查找。
Erlang VM 也可能能够优化列表和元组内部的模式。鉴于模式匹配通常更具表现力,事实上它平均更快并且仅在最坏情况下是线性的,这是一个非常好的加分项。