Python 检查在线网络词汇表中是否存在条目
Python check if entry exists in online web glossary
我想开发一个 Python 脚本,它可以搜索以下网络词汇表以查看条目是否存在。
单词定义的url是:
glossary.ametsoc.org/wiki/[字]
如果单词在词汇表中有定义,则返回定义(即 https://glossary.ametsoc.org/wiki/Pressure)
如果该词不存在于词汇表中,则返回一个这样说的网页(即https://glossary.ametsoc.org/wiki/Peanuts)
我的想法是,我可以取一些词,查看 url 页面的 url 最后使用该词,如果它与“不存在任何词”网页相匹配, 我知道这个词在词汇表中不存在。
我实际上不需要从网页中提取定义,我只需要知道是否有条目即可。
您无需检查页面内容。不存在的页面,例如 Peanuts
页面,return 一个 404
而好的页面 return 一个 200
.
所以你只需要检查 return 代码
像
word = "Pressure"
page = requests.get(f"https://glossary.ametsoc.org/wiki/{word}")
if page.status_code == 200:
print("entry exists")
else:
print("bad page")
我想开发一个 Python 脚本,它可以搜索以下网络词汇表以查看条目是否存在。
单词定义的url是: glossary.ametsoc.org/wiki/[字]
如果单词在词汇表中有定义,则返回定义(即 https://glossary.ametsoc.org/wiki/Pressure)
如果该词不存在于词汇表中,则返回一个这样说的网页(即https://glossary.ametsoc.org/wiki/Peanuts)
我的想法是,我可以取一些词,查看 url 页面的 url 最后使用该词,如果它与“不存在任何词”网页相匹配, 我知道这个词在词汇表中不存在。
我实际上不需要从网页中提取定义,我只需要知道是否有条目即可。
您无需检查页面内容。不存在的页面,例如 Peanuts
页面,return 一个 404
而好的页面 return 一个 200
.
所以你只需要检查 return 代码 像
word = "Pressure"
page = requests.get(f"https://glossary.ametsoc.org/wiki/{word}")
if page.status_code == 200:
print("entry exists")
else:
print("bad page")