GriGain 执行请求失败(连接失败)

GriGain Failed to perform request (connection failed)

我正在 运行ning 一个 hadoop 作业,它迭代一个浮点矩阵来做一些计算。除此之外,我还使用 GridGain Hadoop 加速器在内存中完成这项工作。但是,当我尝试 运行 我的计算 1000 次迭代时,发生了一些奇怪的事情。引发此异常:

Caused by: class org.gridgain.client.impl.connection.GridClientConnectionResetException: Failed to perform request (connection failed): /127.0.0.1:11211

更奇怪的是,抛出异常时节点是OK的,计算似乎还在继续,但是因为异常我无法得到最终的打印结果。

这是在映射阶段完成的计算代码:

float lineResult = 0.0f;
float[] linesResults = new float[lines.length];

for(int x = 0; x < numberOfIterationsPerLine; x++)
{
    for(int y = 0; y < lines.length; y++)//line by line
    {
        lineResult = 0.0f;
        for(int i = 0; i < lines[y].length; i++)//value by value
        {   
            if(i == 0)
                lineResult += lines[y][i] * lines[y][i];
            else
            {
                for(int j = 0; j <= i; j++)
                    lineResult += lines[y][j] * lines[y][i];
            }
        }
        linesResults[y] += lineResult; 
    }
}

for(int z = 0; z < lines.length; z++)
    //write the result
    context.write(new LongWritable(1), new FloatWritable(linesResults[z]));

我还为节点尝试了不同大小的堆,从 2GB 到 4GB。这一切都在同一台机器上完成。

有没有人遇到过类似的问题?

感谢关注

这可能是由于 Ignite 作业跟踪器(默认端口 11211)上的空闲超时所致。 请尝试通过节点配置增加空闲超时(默认值为 7000):

<bean id="grid.cfg" class="org.apache.ignite.configuration.IgniteConfiguration">
...
    <property name="connectorConfiguration">
        <bean class="org.apache.ignite.configuration.ConnectorConfiguration">
            <property name="port" value="11211"/>
            <property name="idleTimeout" value="100000"/>
        </bean>
    </property>