如何在 Spring 批处理中分别读取平面文件 header 和 body

How to read flat file header and body separately in Spring Batch

我正在使用 Spring Batch 和 Spring Boot 做一个简单的批处理作业。

我需要读取一个平面文件,将 header 数据(第一行)与 body 数据(其余行)分开以进行单独的业务逻辑处理,然后将所有内容写入单个文件文件。

如您所见,header 有 5 个参数必须映射到一个 class,而 body 有 12 个必须映射到另一个参数.

我首先想到使用 FlatFileItemReader 并跳过 header。然后使用 skippedLinesCallback 来处理该行,但我不知道该怎么做。

我是 Spring 批处理和 Java 配置的新手。如果有人可以帮助我为我的问题编写解决方案,我真的很感激!

我把输入文件留在这里:

01.01.2017|SUBDCOBR|12:21:23|01/12/2016|31/12/2016
01.01.2017|12345678231234|0002342434|BORGIA RUBEN|27-32548987-9|FA|A|2062-
00010443/444/445|142,12|30/08/2017|142,01
01.01.2017|12345673201234|2342434|ALVAREZ ESTHER|27-32533987-9|FA|A|2062-
00010443/444/445|142,12|30/08/2017|142,02
01.01.2017|12345673201234|0002342434|LOPEZ LUCRECIA|27-32553387-9|FA|A|2062-
00010443/444/445|142,12|30/08/2017|142,12
01.01.2017|12345672301234|0002342434|SILVA JESUS|27-32558657-9|NC|A|2062-
00010443|142,12|30/08/2017|142,12

干杯!

编辑 1: 这将是我的第一次尝试。我的 "body" POJO 称为 DetalleFacturacion,我的 "header" POJO 是 CabeceraFacturacion。 reader 我想用 DetalleFacturacion pojo 来做,所以我可以跳过 header 并稍后再处理它......但是我不确定如何将 header 的数据分配到CabeceraFacturacion.

public FlatFileItemReader<DetalleFacturacion> readerDetalleFacturacion(){

    FlatFileItemReader<DetalleFacturacion> reader = new FlatFileItemReader<>();

    reader.setLinesToSkip(1);
    reader.setResource(new ClassPathResource("/inputFiles/GLEO-MN170100-PROCESO01-SUBDFACT-000001.txt"));

    DefaultLineMapper<DetalleFacturacion> detalleLineMapper = new DefaultLineMapper<>();

    DelimitedLineTokenizer tokenizerDet = new DelimitedLineTokenizer("|");
    tokenizerDet.setNames(new String[] {"fechaEmision", "tipoDocumento", "letra", "nroComprobante",  
                                "nroCliente", "razonSocial", "cuit", "montoNetoGP", "montoNetoG3",
                                "montoExento", "impuestos", "montoTotal"});

    LineCallbackHandler skippedLineCallback = new LineCallbackHandler() {

        @Override
        public void handleLine(String line) {

            String[] headerSeparado = line.split("|");

            String printDate = headerSeparado[0];
            String reportIdentifier = headerSeparado[1];
            String tituloReporte = headerSeparado[2];
            String fechaDesde = headerSeparado[3];
            String fechaHasta = headerSeparado[4];

            CabeceraFacturacion cabeceraFacturacion = new CabeceraFacturacion();
            cabeceraFacturacion.setPrintDate(printDate);
            cabeceraFacturacion.setReportIdentifier(reportIdentifier);
            cabeceraFacturacion.setTituloReporte(tituloReporte);
            cabeceraFacturacion.setFechaDesde(fechaDesde);
            cabeceraFacturacion.setFechaHasta(fechaHasta);

        }
    };

    reader.setSkippedLinesCallback(skippedLineCallback);

    detalleLineMapper.setLineTokenizer(tokenizerDet);
    detalleLineMapper.setFieldSetMapper(new DetalleFieldSetMapper());
    detalleLineMapper.afterPropertiesSet();
    reader.setLineMapper(detalleLineMapper);

    // Test to check if it is saving correctly data in CabeceraFacturacion
    CabeceraFacturacion cabeceraFacturacion = new CabeceraFacturacion();
    System.out.println("Print Date:"+cabeceraFacturacion.getPrintDate());
    System.out.println("Report Identif: 
    "+cabeceraFacturacion.getReportIdentifier());

    return reader;

}

你是对的。您需要使用 skippedLinesCallback 来处理跳行。

您需要实现LineCallbackHandler接口并在handleLine方法中添加您的处理。

LineCallbackHandler 接口传递文件中要跳过的行的原始行内容。如果linesToSkip设置为2,则调用该接口两次。

这就是您可以定义 Reader 的方法。

Java 配置 - Spring 批次 4

@Bean
    public FlatFileItemReader<POJO> myReader() {

        return FlatFileItemReader<pojo>().
                .setResource(new FileSystemResource("resources/players.csv"));
                .name("myReader")
                .delimited()
                .delimiter(",")
                .names("pro1,pro2,pro3")
                .targetType(POJO.class)
                .skippedLinesCallback(skippedLinesCallback)             
                .build();

    }