从 Python 中的字符串中删除辅音

Question

这是我的代码。我不确定我是否需要一个计数器才能工作。答案应该是 'iiii'.

def eliminate_consonants(x):
        vowels= ['a','e','i','o','u']
        vowels_found = 0
        for char in x:
            if char == vowels:
                print(char)

eliminate_consonants('mississippi')

Answer 1

正在更正您的代码

行if char == vowels:是错误的。它必须是 if char in vowels:。这是因为您需要检查元音列表中是否存在该特定字符。除此之外，您需要 print(char,end = '') （在 python3 中）将输出打印为 iiii 全部在一行中。

最终的程序会是这样的

def eliminate_consonants(x):
        vowels= ['a','e','i','o','u']
        for char in x:
            if char in vowels:
                print(char,end = "")

eliminate_consonants('mississippi')

输出将是

iiii

其他方式包括

使用in一个字符串
```
def eliminate_consonants(x):
    for char in x:
        if char in 'aeiou':
            print(char,end = "")
```
语句 if char in 'aeiou' 看起来很简单，它检查 char 是否出现在字符串 aeiou 中。
A list comprehension
```
 ''.join([c for c in x if c in 'aeiou'])
```
此列表推导式将 return 一个仅包含字符的列表 aeiou
A generator expression
```
''.join(c for c in x if c in 'aeiou')
```
这个 gen exp 将 return 生成器比 return 字符仅当字符在 aeiou
Regular Expressions

您可以使用 re.findall 只发现字符串中的元音。代码
```
re.findall(r'[aeiou]',"mississippi")
```
将 return 在字符串中找到的元音列表，即 ['i', 'i', 'i', 'i']。所以现在我们可以使用 str.join 然后使用
```
''.join(re.findall(r'[aeiou]',"mississippi"))
```
str.translate and maketrans

对于此技术，您需要存储一个将每个非元音字母匹配到 None 类型的映射。为此，您可以使用 string.ascii_lowecase。制作地图的代码是
```
str.maketrans({i:None for i in string.ascii_lowercase if i not in "aeiou"})
```
这将 return 映射。请将其存储在一个变量中（此处 m 用于地图）
```
"mississippi".translate(m)
```
这将从字符串中删除所有非 aeiou 字符。
使用dict.fromkeys

您可以将 dict.fromkeys 与 sys.maxunicode 一起使用。不过记得先import sys！
```
dict.fromkeys(i for i in range(sys.maxunicode+1) if chr(i) not in 'aeiou')
```
现在使用 str.translate。
```
'mississippi'.translate(m)
```
使用bytearray

如J.F.Sebastian in the 所述，您可以使用
创建小写辅音的字节数组
```
non_vowels = bytearray(set(range(0x100)) - set(b'aeiou'))
```
使用这个我们可以翻译这个词，
```
'mississippi'.encode('ascii', 'ignore').translate(None, non_vowels)
```
这将 return b'iiii'。这可以很容易地通过使用 decode 即 b'iiii'.decode("ascii") 转换为 str。
使用bytes

bytes return 是一个字节对象，是 bytearray 的不可变版本。 (是Python3具体)
```
non_vowels = bytes(set(range(0x100)) - set(b'aeiou'))
```
使用这个我们可以翻译这个词，
```
'mississippi'.encode('ascii', 'ignore').translate(None, non_vowels)
```
这将 return b'iiii'。这可以很容易地通过使用 decode 即 b'iiii'.decode("ascii") 转换为 str。

时序比较

Python 3

python3 -m timeit -s "text = 'mississippi'*100; non_vowels = bytes(set(range(0x100)) - set(b'aeiou'))" "text.encode('ascii', 'ignore').translate(None, non_vowels).decode('ascii')"
100000 loops, best of 3: 2.88 usec per loop
python3 -m timeit -s "text = 'mississippi'*100; non_vowels = bytearray(set(range(0x100)) - set(b'aeiou'))" "text.encode('ascii', 'ignore').translate(None, non_vowels).decode('ascii')"
100000 loops, best of 3: 3.06 usec per loop
python3 -m timeit -s "text = 'mississippi'*100;d=dict.fromkeys(i for i in range(127) if chr(i) not in 'aeiou')" "text.translate(d)"
10000 loops, best of 3: 71.3 usec per loop
python3 -m timeit -s "import string; import sys; text='mississippi'*100; m = dict.fromkeys(i for i in range(sys.maxunicode+1) if chr(i) not in 'aeiou')" "text.translate(m)"
10000 loops, best of 3: 71.6 usec per loop
python3 -m timeit -s "text = 'mississippi'*100" "''.join(c for c in text if c in 'aeiou')"
10000 loops, best of 3: 60.1 usec per loop
python3 -m timeit -s "text = 'mississippi'*100" "''.join([c for c in text if c in 'aeiou'])"
10000 loops, best of 3: 53.2 usec per loop
python3 -m timeit -s "import re;text = 'mississippi'*100; p=re.compile(r'[aeiou]')" "''.join(p.findall(text))"
10000 loops, best of 3: 57 usec per loop

时间排序

translate (bytes)    |  2.88
translate (bytearray)|  3.06
List Comprehension   | 53.2
Regular expressions  | 57.0
Generator exp        | 60.1
dict.fromkeys        | 71.3
translate (unicode)  | 71.6

如您所见，使用 bytes 的最终方法是最快的。

Python 3.5

python3.5 -m timeit -s "text = 'mississippi'*100; non_vowels = bytes(set(range(0x100)) - set(b'aeiou'))" "text.encode('ascii', 'ignore').translate(None, non_vowels).decode('ascii')"
100000 loops, best of 3: 4.17 usec per loop
python3.5 -m timeit -s "text = 'mississippi'*100; non_vowels = bytearray(set(range(0x100)) - set(b'aeiou'))" "text.encode('ascii', 'ignore').translate(None, non_vowels).decode('ascii')"
100000 loops, best of 3: 4.21 usec per loop
python3.5 -m timeit -s "text = 'mississippi'*100;d=dict.fromkeys(i for i in range(127) if chr(i) not in 'aeiou')" "text.translate(d)"
100000 loops, best of 3: 2.39 usec per loop
python3.5 -m timeit -s "import string; import sys; text='mississippi'*100; m = dict.fromkeys(i for i in range(sys.maxunicode+1) if chr(i) not in 'aeiou')" "text.translate(m)"
100000 loops, best of 3: 2.33 usec per loop
python3.5 -m timeit -s "text = 'mississippi'*100" "''.join(c for c in text if c in 'aeiou')"
10000 loops, best of 3: 97.1 usec per loop
python3.5 -m timeit -s "text = 'mississippi'*100" "''.join([c for c in text if c in 'aeiou'])"
10000 loops, best of 3: 86.6 usec per loop
python3.5 -m timeit -s "import re;text = 'mississippi'*100; p=re.compile(r'[aeiou]')" "''.join(p.findall(text))"
10000 loops, best of 3: 74.3 usec per loop

时间排序

translate (unicode)  |  2.33
dict.fromkeys        |  2.39
translate (bytes)    |  4.17
translate (bytearray)|  4.21
List Comprehension   | 86.6
Regular expressions  | 74.3
Generator exp        | 97.1

Answer 2

== 测试是否相等。您要查看列表 'vowels' 中的字符串中是否存在任何字符。为此，您可以简单地使用 in，如下所示。

此外，我看到您有一个 'vowels_found' 变量但没有使用它。下面是一个如何解决这个问题的例子：

def eliminate_consonants(x):
    vowels= ['a','e','i','o','u']
    vowels_found = 0
    for char in x:
        if char in vowels:
            print(char)
            vowels_found += 1

    print "There are", vowels_found, "vowels in", x

eliminate_consonants('mississippi')

你的输出将是：

i
i
i
i
There are 4 vowels in mississippi

Answer 3

你可以尝试这样的 pythonic 方式，

In [1]: s = 'mississippi'
In [3]: [char for char in s if char in 'aeiou']
Out[3]: ['i', 'i', 'i', 'i']

函数；

In [4]: def eliminate_consonants(x):
   ...:     return ''.join(char for char in x if char in 'aeiou')
   ...: 

In [5]: print(eliminate_consonants('mississippi'))
iiii

从 Python 中的字符串中删除辅音

Deleting consonants from a string in Python

python

string

list

python-idle

python-3.x

正在更正您的代码

其他方式包括

时序比较

Python 3

Python 3.5