如何为列中的每个值提取行数?
How to extract number of rows for every value in a column?
我有一个巨大的 excel,有超过 3 万条记录。
其中一列称为 "Collection",可能有 1000 个不同的值。
我想从 "Collection" 字段的每个值中提取 5 条样本记录。
这将使我们从 3 万条记录中得到 5 千条记录。
如何实现?
插入带有序号的 "A" 列,以便能够按相同顺序重新排列数据 [可选]
在每行中插入 "B" 列并使用 =rand() 并根据此列进行排序以随机排序 [可选]
插入 C2 = COUNTIF(D$2$:D2,D2)<=5 的 "C" 列,然后将公式向下复制到该列中的所有行
假设 "D" 是包含 "Collection" 信息的列
请注意,只有 COUNTIF 中引用单元格中的第一个单元格由 $ 设为绝对单元格。另一个保持相对,当您复制公式时会发生变化。这将使公式只计算其上方在 "Collection" 列上具有相同值的单元格。如果在 "D" 列中有 5 行或更少的行具有相同的值但仅计算上面的单元格,则“<=”运算符将输出 TRUE。最后使用自动过滤器隐藏所有 "C" 列具有 FALSE 值的行。其余行是 "Collection" 列中每个唯一值的 5 个样本。自行决定复制或使用。干杯。
我有一个巨大的 excel,有超过 3 万条记录。 其中一列称为 "Collection",可能有 1000 个不同的值。 我想从 "Collection" 字段的每个值中提取 5 条样本记录。 这将使我们从 3 万条记录中得到 5 千条记录。 如何实现?
插入带有序号的 "A" 列,以便能够按相同顺序重新排列数据 [可选]
在每行中插入 "B" 列并使用 =rand() 并根据此列进行排序以随机排序 [可选]
插入 C2 = COUNTIF(D$2$:D2,D2)<=5 的 "C" 列,然后将公式向下复制到该列中的所有行
假设 "D" 是包含 "Collection" 信息的列
请注意,只有 COUNTIF 中引用单元格中的第一个单元格由 $ 设为绝对单元格。另一个保持相对,当您复制公式时会发生变化。这将使公式只计算其上方在 "Collection" 列上具有相同值的单元格。如果在 "D" 列中有 5 行或更少的行具有相同的值但仅计算上面的单元格,则“<=”运算符将输出 TRUE。最后使用自动过滤器隐藏所有 "C" 列具有 FALSE 值的行。其余行是 "Collection" 列中每个唯一值的 5 个样本。自行决定复制或使用。干杯。