IEnumerable<object[]> 和 IEnumerable<object>[] 之间的优雅转换

Elegant transformation between an IEnumerable<object[]> and an IEnumerable<object>[]

有什么方法可以将 IEnumerable<int[]> 转换为 IEnumerable<int>[] 吗?具体来说,我有以下 IEnumerable:

    IEnumerable<int[]> data = new List<int[]>()
    {
    new int[]{1,11},
    new int[]{2,22},
    new int[]{3,33},
    new int[]{4,44},
    // ...
    // ...
    };

我想把它变成下面的形状:

    IEnumerable<int>[] data = new List<int>[] 
    { 
    new List<int>(){1,2,3,4 },
    new List<int>(){11,22,33,44}
    };

到目前为止我想出的唯一解决方案如下:

public static IEnumerable<int>[] Convert(IEnumerable<int[]> data)
{
    var length = data.First().Length;
    var output = new List<int>[length];
    for (int i = 0; i < length; i++)   
        output[i] = new List<int>();
    foreach (var entry in data) 
    {
        for (int i = 0; i < length; i++)    
        {
            output[i].Add(entry[i]);
        }
    }
    return output;
}

虽然这并不理想,因为我需要遍历整个数据集。理想的解决方案是使用 LINQ 或内置迭代器模式功能 (yield return)。这个问题有更好的解决办法吗?

如果不介意data的多重枚举,可以这样做:

public static IEnumerable<int>[] Convert(IEnumerable<int[]> data)
{
    var length = data.First().Length;
    var output = new IEnumerable<int>[length];
    for (int i = 0; i < length; i++)
    {
        output[i] = CustomEnumerable(i);
    }

    return output;

    IEnumerable<int> CustomEnumerable(int index)
    {
        foreach (var entry in data) 
        {
            yield return entry[index];
        }
    }
}

如您所见,我没有填充列表,而是返回自定义 IEnumerable<int>s,它们是使用本地迭代器函数(使用 yield return)创建的。

如果您只想迭代 data 一次,您可以这样做:

IEnumerable<int>[] Convert(IEnumerable<int[]> data)
{
    var found = new List<int[]>();
    using var enumerator = data.GetEnumerator();
    var proxy = ProxyEnumerable();
    
    var length = proxy.First().Length;
    var output = new IEnumerable<int>[length];
    for (int i = 0; i < length; i++)
    {
        output[i] = CustomEnumerable(i);
    }

    return output;

    IEnumerable<int> CustomEnumerable(int index)
    {
        foreach (var entry in proxy) 
        {
            yield return entry[index];
        }
    }
    
    IEnumerable<int[]> ProxyEnumerable()
    {    
        foreach (var value in found)
        {
            yield return value;
        }

        while (enumerator.MoveNext())
        {
            var value = enumerator.Current;
            found.Add(value);
            yield return value;
        }
    }
}

我在这里添加了另一个 IEnumerable<int[]>,它在我们迭代它时填充缓存 List<int[]>。这样data只迭代一次,后续迭代使用缓存。

Try it online.

我有一个关于 LINQ 的简短建议。通过下面的示例,您可以获得锯齿状数组

var maxLength = data.Max(x => x.Length);
var converted = new IEnumerable<int>[maxLength]
    .Select((dst, index) => data
        .Select(src => src.Length > index ? src[index] : default)
        .Where(n => n != default));

这样您就可以将源数组切割成矩阵

var minLength = data.Min(x => x.Length);
var converted = new IEnumerable<int>[minLength]
    .Select((dst, index) => data
        .Select(src => src[index]));