OpenRefine 乘以 Header 行

OpenRefine Multiply Header Rows

我有一个 csv 文件,其中包含一些多年的数据。在数据提供者的终极智慧中,数据的结构实际上是乘以 header 行(每年一个)。

对于文件顶部的示例,我有:

All | 2004 | Team | Player then some other rows

然后在 2004 年的所有数据之后还有另一个 header 行,如下所示:

All | 2005 | Team | Player

OpenRefine 有解决这个问题的方法吗?

据我了解,您的数据是这样构造的。

All,2004,Team,Player

1, data1,team1,Player1

2, data2,team2,Player2

3, data3,team3,Player3

All,2005,Team,Player

4, data4,team4,Player4

如果这是正确的,一种可能的解决方案是创建一个 "year" 列,然后删除 headers。这是使用正则表达式 ^\d{4}$ 来隔离年份的可能性。