如何从 HTML 中提取一些特定的值?
How to extract some specific values from HTML?
我正在尝试使用 rvest
从 R 中的 ASP.NET HTML 元素中提取一些值。
我正在尝试使用 selectorgadget 来识别我需要的元素,但我不确定我是否正确地进行了操作:
main =read_html(html_detallepersona)
Name = a %>% html_elements("fieldset+ fieldset > ul~ ul+ ul li:nth-child(1)")
paste(Name)
[1] "<li>\r\n <span id=\"ctl00_cphMain_lblPrimerNombre\" class=\"label\">Primer Nombre(*)</span>\r\n <input name=\"ctl00$cphMain$txtPrimerNombre\" type=\"text\" value=\"Veronica\" maxlength=\"30\" id=\"ctl00_cphMain_txtPrimerNombre\" disabled class=\"aspNetDisabled comboBox\" style=\"text-transform: capitalize;\">\n</li>"
Name %>% html_attr("value")
[1] NA
我需要值本身 (Veronica)
来源 HTML 看起来像这样,所以我不知道 rvest 方法是否适合我的情况。我依靠 input name
来获得它旁边的所需值。
编辑 1:
下拉菜单怎么样?我正在寻找“Contributivo”值
Regimen = detallepersona %>% html_elements("#ctl00_cphMain_upAseguradora ul:nth-child(1) li:nth-child(1) option") #%>% html_text()
paste(Regimen)
[1] "<option value=\"0\">-Seleccione-</option>\n" "<option selected value=\"58\">Contributivo</option>\n"
[3] "<option value=\"61\">Especial</option>\n" "<option value=\"60\">Pobre no afiliado</option>\n"
[5] "<option value=\"59\">Subsidiado</option>"
Regimen %>% html_text()
[1] "-Seleccione-" "Contributivo" "Especial" "Pobre no afiliado" "Subsidiado"
现在你在 select 在 <li>
元素中,如果你想要 value=
属性,那么你可以 select 使用 html_attr()
函数.
Name %>% html_attr("value")
我正在尝试使用 rvest
从 R 中的 ASP.NET HTML 元素中提取一些值。
我正在尝试使用 selectorgadget 来识别我需要的元素,但我不确定我是否正确地进行了操作:
main =read_html(html_detallepersona)
Name = a %>% html_elements("fieldset+ fieldset > ul~ ul+ ul li:nth-child(1)")
paste(Name)
[1] "<li>\r\n <span id=\"ctl00_cphMain_lblPrimerNombre\" class=\"label\">Primer Nombre(*)</span>\r\n <input name=\"ctl00$cphMain$txtPrimerNombre\" type=\"text\" value=\"Veronica\" maxlength=\"30\" id=\"ctl00_cphMain_txtPrimerNombre\" disabled class=\"aspNetDisabled comboBox\" style=\"text-transform: capitalize;\">\n</li>"
Name %>% html_attr("value")
[1] NA
我需要值本身 (Veronica)
来源 HTML 看起来像这样,所以我不知道 rvest 方法是否适合我的情况。我依靠 input name
来获得它旁边的所需值。
编辑 1: 下拉菜单怎么样?我正在寻找“Contributivo”值
Regimen = detallepersona %>% html_elements("#ctl00_cphMain_upAseguradora ul:nth-child(1) li:nth-child(1) option") #%>% html_text()
paste(Regimen)
[1] "<option value=\"0\">-Seleccione-</option>\n" "<option selected value=\"58\">Contributivo</option>\n"
[3] "<option value=\"61\">Especial</option>\n" "<option value=\"60\">Pobre no afiliado</option>\n"
[5] "<option value=\"59\">Subsidiado</option>"
Regimen %>% html_text()
[1] "-Seleccione-" "Contributivo" "Especial" "Pobre no afiliado" "Subsidiado"
现在你在 select 在 <li>
元素中,如果你想要 value=
属性,那么你可以 select 使用 html_attr()
函数.
Name %>% html_attr("value")