如何从 html 表单下拉选项中提取文本?

How to extract text from a html form drop-down options?

最近我正在建立一个网站,我需要所有车型和型号的数据,例如数据类型是sellanycar.com

我需要 'Select Make' 和相应的 'Select Model' 下拉列表中的所有数据:

任何语言的代码都是可以接受的,但 javaScript/jQuery 或 Python 更可取,数据可以是任何格式,例如JSON 或 XLXS 等

A) 在 JS/Node 中,您可以使用 Pupeteer to scrape pages, and Cheerio,提取您想要的 JQuery 样式。

B) 如果您选择此选项,您可以使用 Screaming Frog, to do the same, and set upp XPATH or REGEX extractions. I wrote a small piece on how to set up custom regex extractions 等抓取工具,这可能会有所帮助。