通过 HtmlUnit 下载 CSV 并读入数组

Download CSV through HtmlUnit and read into array

我有一个页面有一个按钮可以下载 CSV 文件格式的信息。该按钮会打开确认对话框以下载文件。我需要将该文件存储到一个临时位置(无论是内存还是保存到实际文件然后删除它),然后将 CSV 中的数据读取到数组中。

我已经尝试了这些问题中的代码 (question 1, question 2, question 3, and ),但这并不是我所需要的——主要是因为他们没有下载 CSV 文件并使用其中的数据。

我不确定是否打开了 ConfirmDialog,但我确实添加了 ConfirmHandler 返回 true 以尝试下载文件。但是,我根本不知道文件在哪里下载。


我登录就好了。我去报告生成器。我生成了一个在新 window 中打开的报告。新的 window 打开很好,我用 WebWindowListener 抓住了它。然后我在新 window 上搜索“另存为 CSV”按钮。我可以找到它,我可以点击它,但是 System.out.print 调用显示 ConfirmHandler 没有触发。

for (DomElement e : newPage.getElementsByTagName("button")) {
    int i = 0;
    webClient.setConfirmHandler(new ConfirmHandler() {
        private static final long serialVersionUID = 1L;
        public boolean handleConfirm(Page arg0, String arg1) {
            System.out.println("Test"); //isn't firing
            return false;
    if (((HtmlButton) e).getAttribute("onclick").contains("CSV")) {
        ((HtmlButton) e).click();
    }else {
        if (i++ == (newPage.getElementsByTagName("button").size() - 1)) throw new AssertionError("CSV button not found");

这个答案的灵感来自this answer

我真的很想在不下载文件的情况下获取 CSV 信息,所以我在 webWindowListenerwebWindowContentChanged(arg0) 方法中,只使用 arg0.getWebWindow().getEnclosingPage().getWebResponse().getContentAsString() 然后使用 String.split()几次得到我想要的信息。


webClient.addWebWindowListener(new WebWindowListener() {

    public void webWindowContentChanged(WebWindowEvent arg0) {
        if (CSVclicked) {           //boolean that is set true when I click the download button...
            String CSV = arg0.getWebWindow().getEnclosedPage().getWebResponse().getContentAsString();

            //do things...

            CSVclicked = false; //don't use the same behavior next time the method is called...