Spring 云数据流:列 "TASK_NAME" 的值太长(DeployerPartitionHandler with Spring Batch)
Spring Cloud Data Flow : Value too long for column "TASK_NAME" (DeployerPartitionHandler with Spring Batch)
我有一个简单的 Spring 批处理作业 运行 Kubernetes 作为 Spring 云任务。此作业使用 Spring 批处理分区在同一 Kubernetes 集群上进一步启动分区步骤作为任务 pods。
主要工作:(相关部分)
@Bean
public Job mainControllerJob() {
LOGGER.info("Creating mainControllerJobbean...");
return jobBuilderFactory.get("mainControllerJob").incrementer(new RunIdIncrementer())
.start(testStep(null, null, null)).build();
}
@Bean
public Step testStep(StepBuilderFactory stepBuilderFactory,
@Qualifier("testPartitioner") Partitioner partitioner, PartitionHandler partitionHandler) {
LOGGER.info("Creating testStep");
return stepBuilderFactory.get("testStep")
.partitioner("testWorkerStep", partitioner).partitionHandler(partitionHandler).build();
}
@Bean
public DeployerPartitionHandler partitionHandler(@Value("${test.partion.app}") String resourceLocation,
@Value("${test.application.name}") String applicationName, ApplicationContext context,
TaskLauncher taskLauncher, JobExplorer jobExplorer, DockerResourceLoader dockerResourceLoader) {
Resource resource = dockerResourceLoader.getResource(resourceLocation);
DeployerPartitionHandler partitionHandler = new DeployerPartitionHandler(taskLauncher, jobExplorer, resource,
"testWorkerStep", taskRepository);
List<String> commandLineArgs = new ArrayList<>();
commandLineArgs.add("--spring.cloud.task.initialize.enable=false");
commandLineArgs.add("--spring.batch.initializer.enabled=false");
commandLineArgs.addAll(Arrays.stream(applicationArguments.getSourceArgs()).filter(
x -> !x.startsWith("--spring.profiles.active=") && !x.startsWith("--spring.cloud.task.executionid="))
.collect(Collectors.toList()));
commandLineArgs.addAll(applicationArguments.getNonOptionArgs());
partitionHandler.setCommandLineArgsProvider(new PassThroughCommandLineArgsProvider(commandLineArgs));
partitionHandler.setEnvironmentVariablesProvider(new NoOpEnvironmentVariablesProvider());
partitionHandler.setMaxWorkers(maxWorkers);
partitionHandler.setGridSize(gridSize);
partitionHandler.setApplicationName(applicationName);
return partitionHandler;
}
当上述作业在 k8 上启动子步骤(任务窗格)时,我看到子步骤出现以下异常:
org.springframework.context.ApplicationContextException: Failed to start bean 'taskLifecycleListener'; nested exception is org.springframework.dao.DataIntegrityViolationException: PreparedStatementCallback; SQL [UPDATE TASK_EXECUTION set START_TIME = ?, TASK_NAME = ?, LAST_UPDATED = ?, PARENT_EXECUTION_ID = ? where TASK_EXECUTION_ID = ?];
Value too long for column """TASK_NAME"" VARCHAR(100)": "'test-app,test-app_testJob_testWorkerStep:partition5800' (106)";
SQL statement:
UPDATE TASK_EXECUTION set START_TIME = ?, TASK_NAME = ?, LAST_UPDATED = ?, PARENT_EXECUTION_ID = ? where TASK_EXECUTION_ID = ? [22001-199]; nested exception is org.h2.jdbc.JdbcSQLDataException: Value too long for column """TASK_NAME"" VARCHAR(100)"
错误很明显。我需要以某种方式缩短子分区步骤的名称,使其适合内部 TASK_EXECUTION table.
的 ecolumn 宽度
我想了解的是如何更改 Spring 批处理作业启动的子分区步骤的名称?
大致理解为SimpleStepExecutionSplitter正在创建步骤名。但是,我看不到以编程方式覆盖此行为的方法。如何更改子步骤名称并确保我这样做不会影响我的 jobs/steps.
的可重启性
工作步骤名称是步骤名称和分区名称的串联(中间有一个分隔符)。可以使用 PartitionNameProvider 自定义分区名称。因此,如果您想控制分区名称的生成方式,您需要让 Partitioner
实现 PartitionNameProvider
接口。
另一种选择是增加 TASK_NAME
列的大小。
我有一个简单的 Spring 批处理作业 运行 Kubernetes 作为 Spring 云任务。此作业使用 Spring 批处理分区在同一 Kubernetes 集群上进一步启动分区步骤作为任务 pods。
主要工作:(相关部分)
@Bean
public Job mainControllerJob() {
LOGGER.info("Creating mainControllerJobbean...");
return jobBuilderFactory.get("mainControllerJob").incrementer(new RunIdIncrementer())
.start(testStep(null, null, null)).build();
}
@Bean
public Step testStep(StepBuilderFactory stepBuilderFactory,
@Qualifier("testPartitioner") Partitioner partitioner, PartitionHandler partitionHandler) {
LOGGER.info("Creating testStep");
return stepBuilderFactory.get("testStep")
.partitioner("testWorkerStep", partitioner).partitionHandler(partitionHandler).build();
}
@Bean
public DeployerPartitionHandler partitionHandler(@Value("${test.partion.app}") String resourceLocation,
@Value("${test.application.name}") String applicationName, ApplicationContext context,
TaskLauncher taskLauncher, JobExplorer jobExplorer, DockerResourceLoader dockerResourceLoader) {
Resource resource = dockerResourceLoader.getResource(resourceLocation);
DeployerPartitionHandler partitionHandler = new DeployerPartitionHandler(taskLauncher, jobExplorer, resource,
"testWorkerStep", taskRepository);
List<String> commandLineArgs = new ArrayList<>();
commandLineArgs.add("--spring.cloud.task.initialize.enable=false");
commandLineArgs.add("--spring.batch.initializer.enabled=false");
commandLineArgs.addAll(Arrays.stream(applicationArguments.getSourceArgs()).filter(
x -> !x.startsWith("--spring.profiles.active=") && !x.startsWith("--spring.cloud.task.executionid="))
.collect(Collectors.toList()));
commandLineArgs.addAll(applicationArguments.getNonOptionArgs());
partitionHandler.setCommandLineArgsProvider(new PassThroughCommandLineArgsProvider(commandLineArgs));
partitionHandler.setEnvironmentVariablesProvider(new NoOpEnvironmentVariablesProvider());
partitionHandler.setMaxWorkers(maxWorkers);
partitionHandler.setGridSize(gridSize);
partitionHandler.setApplicationName(applicationName);
return partitionHandler;
}
当上述作业在 k8 上启动子步骤(任务窗格)时,我看到子步骤出现以下异常:
org.springframework.context.ApplicationContextException: Failed to start bean 'taskLifecycleListener'; nested exception is org.springframework.dao.DataIntegrityViolationException: PreparedStatementCallback; SQL [UPDATE TASK_EXECUTION set START_TIME = ?, TASK_NAME = ?, LAST_UPDATED = ?, PARENT_EXECUTION_ID = ? where TASK_EXECUTION_ID = ?];
Value too long for column """TASK_NAME"" VARCHAR(100)": "'test-app,test-app_testJob_testWorkerStep:partition5800' (106)";
SQL statement:
UPDATE TASK_EXECUTION set START_TIME = ?, TASK_NAME = ?, LAST_UPDATED = ?, PARENT_EXECUTION_ID = ? where TASK_EXECUTION_ID = ? [22001-199]; nested exception is org.h2.jdbc.JdbcSQLDataException: Value too long for column """TASK_NAME"" VARCHAR(100)"
错误很明显。我需要以某种方式缩短子分区步骤的名称,使其适合内部 TASK_EXECUTION table.
的 ecolumn 宽度我想了解的是如何更改 Spring 批处理作业启动的子分区步骤的名称?
大致理解为SimpleStepExecutionSplitter正在创建步骤名。但是,我看不到以编程方式覆盖此行为的方法。如何更改子步骤名称并确保我这样做不会影响我的 jobs/steps.
的可重启性工作步骤名称是步骤名称和分区名称的串联(中间有一个分隔符)。可以使用 PartitionNameProvider 自定义分区名称。因此,如果您想控制分区名称的生成方式,您需要让 Partitioner
实现 PartitionNameProvider
接口。
另一种选择是增加 TASK_NAME
列的大小。