如何使用 urllib.request 获取文件的 url 列表?
How to get list of file's url using urllib.request?
from urllib.request import urlopen
import re
urlpath =urlopen("http://blablabla.com/file")
string = urlpath.read().decode('utf-8')
pattern = re.compile('*.docx"')
onlyfiles = pattern.findall(string)
print(onlyfiles)
目标输出
['http://blablabla.com/file/1.docx','http://blablabla.com/file/2.docx']
但是我明白了
[]
尝试此操作时收到此错误消息。
re.error: nothing to repeat at position 0
本行的明星:
pattern = re.compile('*.docx"')
似乎是一个 python 已知错误:
查看相关回答:regex error - nothing to repeat
尝试使用 word 或 a-z 正则表达式:
pattern = re.compile('\w*.docx"')
# or
pattern = re.compile('[a-zA-Z0-9]*.docx"')
from urllib.request import urlopen
import re
urlpath =urlopen("http://blablabla.com/file")
string = urlpath.read().decode('utf-8')
pattern = re.compile('*.docx"')
onlyfiles = pattern.findall(string)
print(onlyfiles)
目标输出
['http://blablabla.com/file/1.docx','http://blablabla.com/file/2.docx']
但是我明白了
[]
尝试此操作时收到此错误消息。
re.error: nothing to repeat at position 0
本行的明星:
pattern = re.compile('*.docx"')
似乎是一个 python 已知错误:
查看相关回答:regex error - nothing to repeat
尝试使用 word 或 a-z 正则表达式:
pattern = re.compile('\w*.docx"')
# or
pattern = re.compile('[a-zA-Z0-9]*.docx"')