vba 中的 chromedriver Selenium

chromedriver Selenium in vba

我目前正在为编码而苦苦挣扎,需要专家的帮助。帮助。 link 主页上有大量 classes(“df-table”)。第一个class通过各种尝试和努力才得以进入excelsheet,但是第二个class("df-table"),第三个 class ("df-table") 等很难弄清楚该怎么做。网上找了各种资源,都说用nth-of-type或者用xpath可以解决,但是一直报错。

我要的结果是上传图片的数据值。

我不是编码专家,所以如果你能认为它可能很难自己理解,我将不胜感激。

Public Sub Jaemu()
    
    Application.ScreenUpdating = False
    Application.Calculation = xlCalculationManual
    
    Dim d As WebDriver, ws As Worksheet, URL As String
    
    Set d = New ChromeDriver
    Set ws = ThisWorkbook.Worksheets("gemstone2")
        
    Dim http As New WinHttpRequest
    
    With d
        '.AddArgument "--headless"
        .Start "Chrome"
            
        Dim html As HTMLDocument
        Dim JsonObject As Object
        
        Set html = New HTMLDocument
        URL = "https://globalmonitor.einfomax.co.kr/infomax_ds.html#/USA/1/1"
        .get URL, Raise:=False  ' set raise to false to avoid a timeout error
        d.FindElementByCss("[ng-click='openStockSearchPopup();']").Click
        d.FindElementByCss("[ng-enter='searchStockSearchPopup(true);']").SendKeys "GOOGL"
        d.FindElementByCss("[ng-click='searchStockSearchPopup(true);']").Click
        d.FindElementByCss("[class='slick-cell l1 r1 text-center clickable']").Click
        Cells(2, 1).Value = d.FindElementByCss("[class='df-table']").Text
        Cells(3, 1).Value = d.FindElementByCss(".table-contents[ng-if='IS_RT_STATE_SUCCESS(requeststate.prospectData)'] > .df-table").Text

    End With
End Sub

原OP错误:

问题代码行是这样的。运行时错误 32.

Cells(3, 1).Value = d.FindElementByCss("[class='df-table' class:nth-of-type(2)]").Text

编辑:最初建议使用不同的 CSS 选择器后出现新错误:

问题代码行是这样的。运行时错误 7 .

Cells(3, 1).Value = d.FindElementByCss(".table-contents[ng-if='IS_RT_STATE_SUCCESS(requeststate.prospectData)'] > .df-table").Text

初始错误 (RTE32):

:nth-of-type() 伪 class 选择器将超出属性选择器关闭 ]"[class='df-table']:nth-of-type(2)",但是这不提供匹配。

您可以使用:

.table-contents[ng-if='IS_RT_STATE_SUCCESS(requeststate.prospectData)'] > .df-table

这 returns 是一个单一的匹配并且足够具体,并且不依赖于长选择器列表,因此它可能相当稳定。根据经验。

如果您想使用 :nth-of-type(),您可以在父元素上使用它并进行第一个匹配,但是如果 html 发生变化,那会不太稳定并且容易崩溃:

.contents-area:nth-of-type(5) .df-table

Follow-up 错误 (RTE7):

元素需要滚动到视图中。

一个不理想的方法是(你的里程可能会有所不同):

d.ExecuteScript "window.scrollTo(0, document.body.scrollHeight/3);"
Application.Wait Now + TimeSerial(0, 0, 2)
Activesheet.Cells(1,3) = d.FindElementByCss(".table-contents[ng-if='IS_RT_STATE_SUCCESS(requeststate.prospectData)'] > .df-table").Text

内置函数和自定义 JS 有更好的方法,您可以从作者 GitHub 上的 examples.xlsm 中提取这些方法。因为我只能用 Python 进行测试,所以这是一个快速但有效的肮脏测试。


您可以避免浏览器开销并使用 XHR 获取 JSON 响应,然后使用 JSON 解析器,如下所示:

Option Explicit

Public Sub GetData()
    Dim s As String

    With CreateObject("MSXML2.XMLHTTP")
        .Open "POST", "https://globalmonitor.einfomax.co.kr/facset/getKeyData", False
        .SetRequestHeader "User-Agent", "Mozilla/5.0"
        .SetRequestHeader "content-type", "application/json;charset=UTF-8"
        .send "{""param"":""NAS:AAPL""}"
        s = .responsetext
    End With

   Debug.Print s

End Sub