Scraping - 清理带有非常量数据的碎片

Scraping - Clean up scrape with non constant data

我正在做一些网页抓取。

我的输出数据在第 1 列:

提交日期:YYYY-MM-DD HH:MM

我只需要YYYY-MM-DD

我添加了这个脚本来删除 "Submission date: "

var cleanup = function(results) {

  $.each(results, function(){                

   this.values[0] = this.values[0].replace("Submission date: ", "");
        this.values[1] = this.values[1].replace("Case number: ", "");

  });

  return results;                           
};

如何删除 HH:MM? 记住数据每次都会改变

一种简单的方法可能是在其分隔符处拆分字符串。给定一个字符串,如“2019-1-20 12:30”,在分隔符处拆分,在本例中为 space:

var value = "2019-1-20 12:30";
var parts = value.split(" "); // ["2019-1-20", "12:30"]
var dateOnly = parts[0];