使用 python 和 selenium 在亚马逊网页上废弃 asin

Question

有人知道如何在这部分源代码上制作废弃的 asin 吗？ Asin总是在网页产品的源代码的同一部分。

我试过了：

asin_n = WebDriverWait(driver,5).until(EC.presence_of_element_located((By.XPATH, "(//td[@class='.prodDetAttrValue'])"))).text

和

asin_n = WebDriverWait(driver, 5).until(EC.visibility_of_element_located((By.CSS_SELECTOR, "(//td[@class='.prodDetAttrValue'])"))).text

和

asin_n = WebDriverWait(driver,20).until(EC.visibility_of_element_located((By.XPATH, "//td[@class='a-size-base prodDetAttrValue']"))).text

和

asin_n = driver.find_element_by_css_selector('td.a-size-base.prodDetAttrValue').text

但是不行，请问有人知道如何制作这部分的废料吗？谢谢回复，再见！

Answer 1

prodDetAttrValue 是 class 名称之一，但还有其他 class 名称。所以你需要使用 contains() 来代替，你可以使用以下任一种 :

使用 XPATH 和 prodDetAttrValue class:

asin_n = WebDriverWait(driver, 20).until(EC.visibility_of_element_located((By.XPATH, "//th[contains(., 'ASIN')]//following::td[contains(@class, 'prodDetAttrValue')]"))).text

使用 XPATH 并完成 class:

asin_n = WebDriverWait(driver, 20).until(EC.visibility_of_element_located((By.XPATH, "//th[contains(., 'ASIN')]//following::td[@class='a-size-base prodDetAttrValue']"))).text

使用 python 和 selenium 在亚马逊网页上废弃 asin

Scrap asin on amazon webpage with python and selenium

python

selenium

amazon

webdriver

selenium-webdriver