日期字段的格式通过 Spreadsheet::ParseExcel 更改

Format of the date field gets changed through Spreadsheet::ParseExcel

我有一个 Excel Sheet (A.xls),其中包含以下内容:

Date,Value
10/1/2020,36.91
10/2/2020,36.060001

我在 solaris 5.8 上使用与 Perl v5.6.1 相同的脚本得到了以下输出

>>./a4_test.pl
INFO>Excel File=A.xls,#WorkSheet=1,AuthorID=Sahoo, Ashish
DEBUG>row 2 - col 0:10-2-20
DEBUG>row 2 - col 1:36.060001

我在 solaris 5.11 上使用相同的脚本和 perl v5.26.3 得到不同的日期字段输出

>>./a4_test.pl
INFO>Excel File=A.xls,#WorkSheet=1,AuthorID=Sahoo, Ashish
DEBUG>row 2 - col 0:2020-10-02
DEBUG>row 2 - col 1:36.060001

我在 Solaris 8 机器上使用 0.2602 版本的 Spreadsheet::ParseExcel,在 Solaris 11 机器上使用 0.65 版本。

为什么我在从
读取日期字段时得到不同的输出 excel sheet 通过 Spreadsheet::ParseExcel 模块?

#!/usr/perl/5.12/bin/perl -w
use Spreadsheet::ParseExcel;

my $srce_file = "a.xls"; 
my $oExcel = new Spreadsheet::ParseExcel;
my $oBook = $oExcel->Parse($srce_file); 
my %hah_sheet = ();
my $header_row  = 1;
my($iR, $iC, $oWkS, $oWkC);
my $book = $oBook->{File};
my $nsheet= $oBook->{SheetCount};
my $author= $oBook->{Author};
unless($nsheet){
    print "ERR>No worksheet found for source file:$srce_file\n";
    return 0;
}
else{
    print "INFO>Excel                         
   File=$srce_file,#WorkSheet=$nsheet,AuthorID=$author\n";
}


for(my $iSheet=0; $iSheet < $oBook->{SheetCount} ; $iSheet++) {
    next if($iSheet >0);    
    $oWkS = $oBook->{Worksheet}[$iSheet];

    my $rows = 0;
    for(my $iR = $oWkS->{MinRow}; defined $oWkS->{MaxRow} && $iR <= $oWkS->{MaxRow} ; $iR++) {
        $rows++;

        my $str_len = 0;
        for(my $iC = $oWkS->{MinCol}; defined $oWkS->{MaxCol} && $iC <= $oWkS->{MaxCol}; $iC++) {
            $oWkC = $oWkS->{Cells}[$iR][$iC];
            next if ($iR <$header_row);
            
            if (defined($oWkC)){
                my $cell_value = $oWkC->Value;
                $cell_value =~s/\n+//g;               #removed newline inside the value
                #
                ##if the first column at header row is null then skip. Column might be shifted
                if($iR==$header_row && $iC == 0){
                    last unless($cell_value);
                }
                if($iR == $header_row){
                   $hah_sheet{$iR}{$iC} = uc($cell_value);
                }else {
                   $hah_sheet{$iR}{$iC} = $cell_value;
                   $str_len += length($cell_value);  
                   ##View cell value by row/column
                   print "DEBUG>row ${iR} - col ${iC}:$cell_value\n";
                }
            }else{
                $hah_sheet{$iR}{$iC} = "";              #keep position for NULL value
            }
        } # END of Column loop
    } # END of Row loop
} # END of Worksheet
      

如果您在 Changes 中搜索“日期”,您会看到:

0.33 2008.09.07
    - Default format for formatted dates changed from 'm-d-yy' to 'yyyy-mm-dd'

这解释了为什么您在 Spreadsheet::ParseExcel 的 0.2602 和 0.65 版本之间看到不同的日期格式。

如果无论您使用的是哪个版本,您总是希望您的代码打印相同的格式,您可以转换代码中的日期。例如,如果您总是想看到 yyyy-mm-dd:

$cell_value =~ s/^(\d+)-(\d+)-(\d+)$/sprintf '%04d-%02d-%02d', 2000+, , /e;

或者,反之亦然:

$cell_value =~ s/^(\d+)-(\d+)-(\d+)$/sprintf '%0d-%0d-%02d', , , -2000/e;