Lua 词搜索
Lua word search
我将如何在 Lua 中进行多模式搜索? (我已经设置了 Lpeg)。
例如,假设我连续接收字符串,我一次处理一个字符串,将它们大写并调用它们 msg
。现在我想获取 msg
并检查它是否具有以下任何模式:MUFFIN MOOPHIN MUPHEN M0FF1N
首先。我如何检查 msg
是否有其中任何一个(如果它不止一个无关紧要)而不必写一个巨大的 if(or or or or)
?
您可以做的一件事是制作一个 table 您想要查找的单词,然后使用 gmatch
迭代字符串中的每个单词并检查它是否在 table.
#!/usr/bin/env lua
function matchAny(str, pats)
for w in str:gmatch('%S+') do
if pats[w] then
return true
end
end
return false
end
pats = {
['MUFFIN'] = true,
['MOOPHIN'] = true,
['MUPHEN'] = true,
['M0FF1N'] = true,
}
print(matchAny("I want a MUFFIN", pats)) -- true
print(matchAny("I want more MUFFINs", pats)) -- false
一个迟到的答案,但你可以构建一个模式来匹配所有不区分大小写的单词(仅当后面没有字母数字时),捕获主题和单词索引中的匹配位置,与这样的东西匹配:
local lpeg = require("lpeg")
local function find_words(subj, words)
local patt
for idx, word in ipairs(words) do
word = lpeg.P(word:upper()) * lpeg.Cc(idx)
patt = patt and (patt + word) or word
end
local locale = lpeg.locale()
patt = lpeg.P{ lpeg.Cp() * patt * (1 - locale.alnum) + 1 * lpeg.V(1) }
return patt:match(subj:upper())
end
local words = { "MUFFIN", "MOOPHIN", "MUPHEN", "M0FF1N" }
local pos, idx = find_words("aaaaa bbb ccc muPHEN ddd", words)
-- output: 16, 3
我将如何在 Lua 中进行多模式搜索? (我已经设置了 Lpeg)。
例如,假设我连续接收字符串,我一次处理一个字符串,将它们大写并调用它们 msg
。现在我想获取 msg
并检查它是否具有以下任何模式:MUFFIN MOOPHIN MUPHEN M0FF1N
首先。我如何检查 msg
是否有其中任何一个(如果它不止一个无关紧要)而不必写一个巨大的 if(or or or or)
?
您可以做的一件事是制作一个 table 您想要查找的单词,然后使用 gmatch
迭代字符串中的每个单词并检查它是否在 table.
#!/usr/bin/env lua
function matchAny(str, pats)
for w in str:gmatch('%S+') do
if pats[w] then
return true
end
end
return false
end
pats = {
['MUFFIN'] = true,
['MOOPHIN'] = true,
['MUPHEN'] = true,
['M0FF1N'] = true,
}
print(matchAny("I want a MUFFIN", pats)) -- true
print(matchAny("I want more MUFFINs", pats)) -- false
一个迟到的答案,但你可以构建一个模式来匹配所有不区分大小写的单词(仅当后面没有字母数字时),捕获主题和单词索引中的匹配位置,与这样的东西匹配:
local lpeg = require("lpeg")
local function find_words(subj, words)
local patt
for idx, word in ipairs(words) do
word = lpeg.P(word:upper()) * lpeg.Cc(idx)
patt = patt and (patt + word) or word
end
local locale = lpeg.locale()
patt = lpeg.P{ lpeg.Cp() * patt * (1 - locale.alnum) + 1 * lpeg.V(1) }
return patt:match(subj:upper())
end
local words = { "MUFFIN", "MOOPHIN", "MUPHEN", "M0FF1N" }
local pos, idx = find_words("aaaaa bbb ccc muPHEN ddd", words)
-- output: 16, 3