如何从 HTML 中提取一些特定的值?

How to extract some specific values from HTML?

我正在尝试使用 rvest 从 R 中的 ASP.NET HTML 元素中提取一些值。

我正在尝试使用 selectorgadget 来识别我需要的元素,但我不确定我是否正确地进行了操作:

main =read_html(html_detallepersona)

Name = a %>% html_elements("fieldset+ fieldset > ul~ ul+ ul li:nth-child(1)")  

paste(Name)
[1] "<li>\r\n                <span id=\"ctl00_cphMain_lblPrimerNombre\" class=\"label\">Primer Nombre(*)</span>\r\n                <input name=\"ctl00$cphMain$txtPrimerNombre\" type=\"text\" value=\"Veronica\" maxlength=\"30\" id=\"ctl00_cphMain_txtPrimerNombre\" disabled class=\"aspNetDisabled comboBox\" style=\"text-transform: capitalize;\">\n</li>"

Name %>%  html_attr("value")
[1] NA

我需要值本身 (Veronica)

来源 HTML 看起来像这样,所以我不知道 rvest 方法是否适合我的情况。我依靠 input name 来获得它旁边的所需值。

编辑 1: 下拉菜单怎么样?我正在寻找“Contributivo”值

 Regimen = detallepersona %>% html_elements("#ctl00_cphMain_upAseguradora ul:nth-child(1) li:nth-child(1) option") #%>%  html_text()

paste(Regimen)
[1] "<option value=\"0\">-Seleccione-</option>\n"           "<option selected value=\"58\">Contributivo</option>\n"
[3] "<option value=\"61\">Especial</option>\n"              "<option value=\"60\">Pobre no afiliado</option>\n"    
[5] "<option value=\"59\">Subsidiado</option>"             

Regimen %>% html_text()
[1] "-Seleccione-"      "Contributivo"      "Especial"          "Pobre no afiliado" "Subsidiado"       

现在你在 select 在 <li> 元素中,如果你想要 value= 属性,那么你可以 select 使用 html_attr() 函数.

Name %>% html_attr("value")