如何使用 casperjs 从嵌入式脚本中检索文本?

How do I retrieve text from an embedded script using casperjs?

html 元素是

<script>
window.sawXmlIslandidClientStateXml="<nqw xmlns:saw=\x22com.siebel.analytics.web/report/v1.1\x22 xmlns:xsi=\x22http://www.w3.org/2001/XMLSchema-instance\x22 xmlns:sawst=\x22com.siebel.analytics.web/state/v1\x22>\u003csawst:clientState>\u003csawst:stateRef>\u003csawst:envState xmlns:sawst=\"com.siebel.analytics.web/state/v1\" xmlns:xsi=\"http://www.w3.org/2001/XMLSchema-instance\" xmlVersion=\"200811100\">\u003csawst:container cid=\"d:dashboard\" xsi:type=\"sawst:topLevelStateContainer\">\u003csawst:container cid=\"p:mco0pb0nob7sqjvg\" xsi:type=\"sawst:page\">\u003csawst:container cid=\"s:42263r43nih80fd1\" xsi:type=\"sawst:section\" rendered=\"true\">\u003csawst:container cid=\"g:c452lvndqssjqa45\" xsi:type=\"sawst:dashprompt\" links=\"-\" promptAutoCompleteState=\"off\"/>\u003c/sawst:container>\u003csawst:container cid=\"r:q4g2fiisnvk4nusv\" xsi:type=\"sawst:report\" links=\"fd\" defaultView=\"compoundView!1\" searchId=\"fvup02s9lt0o6urkplv4pqa5ri\" folder=\"/shared/Sales\" itemName=\"All Sales and Inventory Data\"/>\u003csawst:container cid=\"f:dpstate\" xsi:type=\"sawst:dashpromptstate\" statepoolId=\"ih2bj24l46bkgt558qsef04jeq\"/>\u003csawst:container cid=\"s:b0003tc6gnahvsfq\" xsi:type=\"sawst:section\" rendered=\"true\"/>\u003csawst:container cid=\"s:c5j314uterctfb08\" xsi:type=\"sawst:section\" rendered=\"true\"/>\u003c/sawst:container>\u003c/sawst:container>\u003c/sawst:envState>\u003c/sawst:stateRef>\u003csawst:reportXmlRefferedTo>\u003cref statePath=\"d:dashboard~p:mco0pb0nob7sqjvg~r:q4g2fiisnvk4nusv\" searchID=\"8oh8erup3kcqav10ukp36jaof2\">\u003c/ref>\u003c/sawst:reportXmlRefferedTo>\u003c/sawst:clientState></nqw>";
</script>

我想从此脚本部分检索标识符 statepoolId 下的字符串 ih2bj24l46bkgt558qsef04jeq。那么如何在 HTML 中找到这个脚本并使用 casperjs 获取字符串?

访问window.sawXmlIslandidClientStateXml

这是页面中的一个脚本元素,它向全局范围添加了一个变量,因此您可以简单地通过 casper.evaluate:

访问它
casper.then(function(){
    var sawXmlIslandidClientStateXml = casper.evaluate(function(){
        return window.sawXmlIslandidClientStateXml;
    });
    // TODO: do something
});

sawXmlIslandidClientStateXml 做某事:

你可以

  • 执行简单的字符串操作将字符串拆分为更易于管理的部分,您自己可以更轻松地解析这些部分,
  • 编写一个 Regex 匹配器来查找您要查找的特定详细信息,或者
  • 使用 DOMParser to parse the string as XML and then use either yourParsedDocument.querySelector or yourParsedDocument.evaluate 分别通过 CSS 选择器或 XPath 表达式定位元素。