为什么模式匹配性能并不比 elixir 中的 ifelse/cond 好多少?

why pattern matching performance is not much better than ifelse/cond in elixir?

我听说 erlang beam 通过模式匹配调优很多,因此性能比条件表达式好得多。我在 elixir 中做了一个测试,运行 用 benchfella 进行了基准测试。但是,我发现模式匹配性能与 if/cond 相比几乎是同一水平的性能。

$ mix bench -d 10
Settings:
  duration:      10.0 s
  mem stats:     false
  sys mem stats: false

[12:30:08] 1/3: PatternMatchBench.if else performance
[12:30:28] 2/3: PatternMatchBench.cond performance
[12:30:47] 3/3: PatternMatchBench.pattern match performance
Finished in 57.5 seconds

PatternMatchBench.if else performance:            10000   1723.24 µs/op
PatternMatchBench.cond performance:               10000   1723.36 µs/op
PatternMatchBench.pattern match performance:      10000   1726.95 µs/op

下面是核心代码,主要是在不同情况下将数据格式化为字符串。整个项目可以通过https://github.com/tyrchen/pattern_match.

获得
defmodule Ifelse do
  def process(data) do
    if is_list(data) do
      data
      |> Enum.map(fn(entry) ->
          if is_tuple(entry) do
            {k,v} = entry
            "#{k}: #{v}" |> transform
          else
            entry |> process
          end
      end)
      |> Enum.join("\n")
    else
      if is_map(data) do
        data
        |> Enum.map(fn({k, v}) -> transform("#{k}: #{v}") end)
        |> Enum.join("\n")
      else
        data |> transform
      end
    end
  end

  defp transform(str) do
    "    #{str}"
  end
end

defmodule Cond do
  def process(data) do
    cond do
      is_list(data) ->
        data
        |> Enum.map(fn(item) ->
          cond do
            is_tuple(item) ->
              {k, v} = item
              "#{k}: #{v}" |> transform
            true ->
              item |> process
          end
        end)
        |> Enum.join("\n")
      is_map(data) ->
        data
        |> Enum.map(fn({k, v}) -> "#{k}: #{v}" |> transform end)
        |> Enum.join("\n")
      true ->
        "    #{data}"
    end
  end

  defp transform(str) do
    "    #{str}"
  end

end

defmodule Pattern do
  def process(data) when is_tuple(data) do
    {k, v} = data
    "#{k}: #{v}" |> process
  end

  def process(data) when is_list(data) or is_map(data) do
    data
    |> Enum.map(fn(entry) -> process(entry) end)
    |> Enum.join("\n")
  end

  def process(data) do
    "    #{data}"
  end

end

我错过了什么吗?或者我需要更复杂的测试来找出 erlang VM 模式匹配的强度?

两点:

  1. 为了让您看到任何好处,您需要进行大量测试,因为归根结底,条件检查是线性的 (O(N)) 而模式可以优化为二叉树搜索 (O(log2N))

  2. 尽管如此,并非所有模式都可以同样优化。如果我没记错的话,guard clauses还是线性匹配的

Elixir 用于 Unicode 操作的模式是肯定会启动模式优化的一个更直接的示例:

case codepoint do
  ?á -> ?Á
  ?é -> ?É
  ?í -> ?Í
  ...
  ?ū -> ?Ū
end

在这种情况下,VM 能够构建一棵树,而不是线性测试每个模式直到找到匹配的模式,二叉树将进行更快的查找。

Erlang VM 也可能能够优化列表和元组内部的模式。鉴于模式匹配通常更具表现力,事实上它平均更快并且仅在最坏情况下是线性的,这是一个非常好的加分项。