Spring 云数据流：列 "TASK_NAME" 的值太长（DeployerPartitionHandler with Spring Batch）

Question

我有一个简单的 Spring 批处理作业运行 Kubernetes 作为 Spring 云任务。此作业使用 Spring 批处理分区在同一 Kubernetes 集群上进一步启动分区步骤作为任务 pods。

主要工作：（相关部分）

@Bean
public Job mainControllerJob() {
    LOGGER.info("Creating mainControllerJobbean...");
    return jobBuilderFactory.get("mainControllerJob").incrementer(new RunIdIncrementer())
                .start(testStep(null, null, null)).build();
}

@Bean
public Step testStep(StepBuilderFactory stepBuilderFactory,
        @Qualifier("testPartitioner") Partitioner partitioner, PartitionHandler partitionHandler) {
    LOGGER.info("Creating testStep");
    return stepBuilderFactory.get("testStep")
            .partitioner("testWorkerStep", partitioner).partitionHandler(partitionHandler).build();
}

@Bean
public DeployerPartitionHandler partitionHandler(@Value("${test.partion.app}") String resourceLocation,
        @Value("${test.application.name}") String applicationName, ApplicationContext context,
        TaskLauncher taskLauncher, JobExplorer jobExplorer, DockerResourceLoader dockerResourceLoader) {
    Resource resource = dockerResourceLoader.getResource(resourceLocation);
    DeployerPartitionHandler partitionHandler = new DeployerPartitionHandler(taskLauncher, jobExplorer, resource,
            "testWorkerStep", taskRepository);

    List<String> commandLineArgs = new ArrayList<>();
    commandLineArgs.add("--spring.cloud.task.initialize.enable=false");
    commandLineArgs.add("--spring.batch.initializer.enabled=false");

    commandLineArgs.addAll(Arrays.stream(applicationArguments.getSourceArgs()).filter(
            x -> !x.startsWith("--spring.profiles.active=") && !x.startsWith("--spring.cloud.task.executionid="))
            .collect(Collectors.toList()));
    commandLineArgs.addAll(applicationArguments.getNonOptionArgs());

    partitionHandler.setCommandLineArgsProvider(new PassThroughCommandLineArgsProvider(commandLineArgs));
    partitionHandler.setEnvironmentVariablesProvider(new NoOpEnvironmentVariablesProvider());
    partitionHandler.setMaxWorkers(maxWorkers);
    partitionHandler.setGridSize(gridSize);
    partitionHandler.setApplicationName(applicationName);

    return partitionHandler;
}

当上述作业在 k8 上启动子步骤（任务窗格）时，我看到子步骤出现以下异常：

 org.springframework.context.ApplicationContextException: Failed to start bean 'taskLifecycleListener'; nested exception is org.springframework.dao.DataIntegrityViolationException: PreparedStatementCallback; SQL [UPDATE TASK_EXECUTION set START_TIME = ?, TASK_NAME = ?, LAST_UPDATED = ?, PARENT_EXECUTION_ID = ? where TASK_EXECUTION_ID = ?]; 
Value too long for column """TASK_NAME"" VARCHAR(100)": "'test-app,test-app_testJob_testWorkerStep:partition5800' (106)"; 
SQL statement:
    UPDATE TASK_EXECUTION set START_TIME = ?, TASK_NAME = ?, LAST_UPDATED = ?, PARENT_EXECUTION_ID = ? where TASK_EXECUTION_ID = ? [22001-199]; nested exception is org.h2.jdbc.JdbcSQLDataException: Value too long for column """TASK_NAME"" VARCHAR(100)"

错误很明显。我需要以某种方式缩短子分区步骤的名称，使其适合内部 TASK_EXECUTION table.

的 ecolumn 宽度

我想了解的是如何更改 Spring 批处理作业启动的子分区步骤的名称？

大致理解为SimpleStepExecutionSplitter正在创建步骤名。但是，我看不到以编程方式覆盖此行为的方法。如何更改子步骤名称并确保我这样做不会影响我的 jobs/steps.

的可重启性

Answer 1

工作步骤名称是步骤名称和分区名称的串联（中间有一个分隔符）。可以使用 PartitionNameProvider 自定义分区名称。因此，如果您想控制分区名称的生成方式，您需要让 Partitioner 实现 PartitionNameProvider 接口。

另一种选择是增加 TASK_NAME 列的大小。

Spring 云数据流：列 "TASK_NAME" 的值太长（DeployerPartitionHandler with Spring Batch）

Spring Cloud Data Flow : Value too long for column "TASK_NAME" (DeployerPartitionHandler with Spring Batch)

java

spring

spring-batch

spring-cloud-task

spring-cloud-dataflow