Lua 词搜索

Lua word search

我将如何在 Lua 中进行多模式搜索? (我已经设置了 Lpeg)。

例如,假设我连续接收字符串,我一次处理一个字符串,将它们大写并调用它们 msg。现在我想获取 msg 并检查它是否具有以下任何模式:MUFFIN MOOPHIN MUPHEN M0FF1N 首先。我如何检查 msg 是否有其中任何一个(如果它不止一个无关紧要)而不必写一个巨大的 if(or or or or)

您可以做的一件事是制作一个 table 您想要查找的单词,然后使用 gmatch 迭代字符串中的每个单词并检查它是否在 table.

#!/usr/bin/env lua

function matchAny(str, pats)
    for w in str:gmatch('%S+') do
        if pats[w] then
            return true
        end
    end
    return false
end

pats = {
    ['MUFFIN']  = true,
    ['MOOPHIN'] = true,
    ['MUPHEN']  = true,
    ['M0FF1N']  = true,
}

print(matchAny("I want a MUFFIN", pats)) -- true
print(matchAny("I want more MUFFINs", pats)) -- false

一个迟到的答案,但你可以构建一个模式来匹配所有不区分大小写的单词(仅当后面没有字母数字时),捕获主题和单词索引中的匹配位置,与这样的东西匹配:

local lpeg = require("lpeg")

local function find_words(subj, words)
    local patt
    for idx, word in ipairs(words) do
        word = lpeg.P(word:upper()) * lpeg.Cc(idx)
        patt = patt and (patt + word) or word
    end
    local locale = lpeg.locale()
    patt = lpeg.P{ lpeg.Cp() * patt * (1 - locale.alnum) + 1 * lpeg.V(1) }
    return patt:match(subj:upper())
end

local words = { "MUFFIN", "MOOPHIN", "MUPHEN", "M0FF1N" }
local pos, idx = find_words("aaaaa  bbb ccc muPHEN ddd", words)

-- output: 16, 3