我应该如何使用 Python 实现工作自动化
how should I automation of work with Python
我是 python 的初学者,但我知道中级 JavaScript。我有一个项目要完成,这就像一个刮刀,但我想为我自动化一些工作。
1 ) 我有一个包含超过 1000 条数据的 Excel,它还有 URLs。我想编码 python 从 Excel sheet 访问每个 URL 并在第一页搜索一些预定义搜索文本(文本列表)
2 ) 如果我的代码从该网页中找到任何文本,那么它应该 return true else false
我想要任何想法或逻辑来做这种过程。任何帮助都会减轻我的头痛
这是一项非常繁重的工作,在 JavaScript 做这件事不是个好主意,这就是为什么我想在 Python
做
我建议如下:
- 阅读有关 csv 库的信息 - 阅读 excel 文件的内容。
- 阅读有关请求库的信息 - 从 URL 中获取页面内容。
- 阅读 re 库中的正则表达式。
一个简单的方法是获取请求模块。然后学习如何使用可以读取 excel 电子表格等电子表格的 csv 模块。那么这就是你想要做的
import csv
import requests
URLS = []
def GetUrlFromCSVFile():
global URLS
#Figure out how to get link from csv file then append them to the URLS list
for url in URLS:
r = requests.get(URL, headers=#You Should Probs get some headers)
if whatever_keyword_u_looking_for in r.text:
print("Found")
else:
print("Not here")
我是 python 的初学者,但我知道中级 JavaScript。我有一个项目要完成,这就像一个刮刀,但我想为我自动化一些工作。 1 ) 我有一个包含超过 1000 条数据的 Excel,它还有 URLs。我想编码 python 从 Excel sheet 访问每个 URL 并在第一页搜索一些预定义搜索文本(文本列表) 2 ) 如果我的代码从该网页中找到任何文本,那么它应该 return true else false 我想要任何想法或逻辑来做这种过程。任何帮助都会减轻我的头痛 这是一项非常繁重的工作,在 JavaScript 做这件事不是个好主意,这就是为什么我想在 Python
做我建议如下:
- 阅读有关 csv 库的信息 - 阅读 excel 文件的内容。
- 阅读有关请求库的信息 - 从 URL 中获取页面内容。
- 阅读 re 库中的正则表达式。
一个简单的方法是获取请求模块。然后学习如何使用可以读取 excel 电子表格等电子表格的 csv 模块。那么这就是你想要做的
import csv
import requests
URLS = []
def GetUrlFromCSVFile():
global URLS
#Figure out how to get link from csv file then append them to the URLS list
for url in URLS:
r = requests.get(URL, headers=#You Should Probs get some headers)
if whatever_keyword_u_looking_for in r.text:
print("Found")
else:
print("Not here")