用于查找和替换 pywikibot 模式的任何英语单词的正则表达式是什么

Question

我写了下面的程序去链接a ta.wikipedia page. Delink means removal of square brackets which are before and after the English words. I am new to PAWS(pywikibot)中的英文单词。似乎可以通过 regex(A-Z,a-z) 来删除。怎么样？

import pywikibot
import re

    site = pywikibot.Site('ta', 'wikipedia')
    page = pywikibot.Page(site, title)
    page.text = page.text.replace('[[Eudicots]]','Eudicots')
    page.save()

对不起我 English.English 是我的桥梁语言。我不是问 debug.But 如何避免以下重复的代码类型。例如，以下 26（字母）代码有助于删除 [[ 括号。

page.text = page.text.replace('[[A','A')
page.text = page.text.replace('[[B','B')
page.text = page.text.replace('[[C','C')
likewise, A to Z
page.text = page.text.replace('[[X','X')
page.text = page.text.replace('[[Y','Y')
page.text = page.text.replace('[[Z','Z')

然后我必须删除总是在单词末尾的小写字母。因为，每个单词都以小写字母结尾。要删除小写字母，我必须编写以下代码，

    page.text = page.text.replace('a]]','a')
    page.text = page.text.replace('b]]','b')
    page.text = page.text.replace('c]]','c')
    page.text = page.text.replace('d]]','d')
     (likewise, for all the 26 English letters)
    page.text = page.text.replace('x]]','x')
    page.text = page.text.replace('y]]','y')

我认为这不是好的编码。所以我想使用正则表达式。我希望我满足了维基媒体项目的需要。

换句话说，我只想删除英文单词的括号而不是英文单词。

Answer 1

一些 PCRE 兼容的正则表达式库可以根据它们的 Unicode 属性匹配字符 classes（例如 \p{Latin} 将匹配拉丁脚本的任何字符），但是 Python' s re 模块没有。您可以使用其他 Python 模块（this answer 有详细信息），但只要您只查找 ASCII 字符，就可以更轻松地构建自己的字符 class：[A-Za-z] 将匹配这些范围内的单个字符，而 re.sub('([A-Za-z])]]', '\1', text) 将保留该字符并丢弃括号。

用于查找和替换 pywikibot 模式的任何英语单词的正则表达式是什么

What is the regex to find any English words for find and replace mode of pywikibot

python

wikipedia-api

pywikibot