Scraping - 清理带有非常量数据的碎片
Scraping - Clean up scrape with non constant data
我正在做一些网页抓取。
我的输出数据在第 1 列:
提交日期:YYYY-MM-DD HH:MM
我只需要YYYY-MM-DD
我添加了这个脚本来删除 "Submission date: "
var cleanup = function(results) {
$.each(results, function(){
this.values[0] = this.values[0].replace("Submission date: ", "");
this.values[1] = this.values[1].replace("Case number: ", "");
});
return results;
};
如何删除 HH:MM?
记住数据每次都会改变
一种简单的方法可能是在其分隔符处拆分字符串。给定一个字符串,如“2019-1-20 12:30”,在分隔符处拆分,在本例中为 space:
var value = "2019-1-20 12:30";
var parts = value.split(" "); // ["2019-1-20", "12:30"]
var dateOnly = parts[0];
我正在做一些网页抓取。
我的输出数据在第 1 列:
提交日期:YYYY-MM-DD HH:MM
我只需要YYYY-MM-DD
我添加了这个脚本来删除 "Submission date: "
var cleanup = function(results) {
$.each(results, function(){
this.values[0] = this.values[0].replace("Submission date: ", "");
this.values[1] = this.values[1].replace("Case number: ", "");
});
return results;
};
如何删除 HH:MM? 记住数据每次都会改变
一种简单的方法可能是在其分隔符处拆分字符串。给定一个字符串,如“2019-1-20 12:30”,在分隔符处拆分,在本例中为 space:
var value = "2019-1-20 12:30";
var parts = value.split(" "); // ["2019-1-20", "12:30"]
var dateOnly = parts[0];