用于查找和替换 pywikibot 模式的任何英语单词的正则表达式是什么

What is the regex to find any English words for find and replace mode of pywikibot

我写了下面的程序去链接a ta.wikipedia page. Delink means removal of square brackets which are before and after the English words. I am new to PAWS(pywikibot)中的英文单词。似乎可以通过 regex(A-Z,a-z) 来删除。怎么样?

import pywikibot
import re

    site = pywikibot.Site('ta', 'wikipedia')
    page = pywikibot.Page(site, title)
    page.text = page.text.replace('[[Eudicots]]','Eudicots')
    page.save()

对不起我 English.English 是我的桥梁语言。我不是问 debug.But 如何避免以下重复的代码类型。 例如,以下 26(字母)代码有助于删除 [[ 括号。

page.text = page.text.replace('[[A','A')
page.text = page.text.replace('[[B','B')
page.text = page.text.replace('[[C','C')
likewise, A to Z
page.text = page.text.replace('[[X','X')
page.text = page.text.replace('[[Y','Y')
page.text = page.text.replace('[[Z','Z')

然后我必须删除总是在单词末尾的小写字母。因为,每个单词都以小写字母结尾。要删除小写字母,我必须编写以下代码,

    page.text = page.text.replace('a]]','a')
    page.text = page.text.replace('b]]','b')
    page.text = page.text.replace('c]]','c')
    page.text = page.text.replace('d]]','d')
     (likewise, for all the 26 English letters)
    page.text = page.text.replace('x]]','x')
    page.text = page.text.replace('y]]','y')

我认为这不是好的编码。所以我想使用正则表达式。 我希望我满足了维基媒体项目的需要。

换句话说,我只想删除英文单词的括号而不是英文单词。

一些 PCRE 兼容的正则表达式库可以根据它们的 Unicode 属性匹配字符 classes(例如 \p{Latin} 将匹配拉丁脚本的任何字符),但是 Python' s re 模块没有。您可以使用其他 Python 模块(this answer 有详细信息),但只要您只查找 ASCII 字符,就可以更轻松地构建自己的字符 class:[A-Za-z] 将匹配这些范围内的单个字符,而 re.sub('([A-Za-z])]]', '\1', text) 将保留该字符并丢弃括号。