OpenXML SDK2.5 (Excel): 如何判断单元格是否包含数值?

OpenXML SDK2.5 (Excel): How to determine if a cell contains a numeric value?

我正忙于开发一个从 MS Excel (2016) 文件导入数据的组件。 该组件使用 MS OpenXML SDK2.5 库。 MS Excel 的最终用户安装基于荷兰国家/地区设置。 该文件包含财务数据(数字)列等。这个栏目位置事先不知道

为了确定单元格是否包含数字数据,我计算了 属性 Cell.DataType(CellValues 类型,它是一个枚举)。 乍一看,属性 似乎是确定这一点的最佳人选。 CellValues 的可能值为: Boolean、Number、Error、SharedString、String、InlineString 或 Date。所以我希望 Cell.DataType 设置为 CellValues.Number。 经过一些调试后,我发现当单元格包含数字数据时 Cell.DataType 为空。

在互联网上搜索解释时,我发现了以下 MSDN 文章: https://msdn.microsoft.com/en-us/library/office/hh298534.aspx

文章准确描述了我在调试过程中发现的内容:

The Cell type provides a DataType property that indicates the type of the data within the cell. The value of the DataType property is null for numeric and date types.

有人知道为什么 Cell.DataType 没有分别用 CellValues.Number 或 CellValues.Date 初始化吗?

确定单元格是否包含数值的最佳方法是什么?

Does anybody know why Cell.DataType is not initialized with respectively CellValues.Number or CellValues.Date?

查看来自 here 的 ECMA-376 标准,Cell 的(缩写)XSD 看起来像这样:

<xsd:complexType name="CT_Cell">
    ...
    <xsd:attribute name="t" type="ST_CellType" use="optional" default="n"/>
    ...
</xsd:complexType>

该属性表示类型。请注意,它是可选的,默认值为 "n"。第 18.18.11 节 ST_CellType(单元格类型)列出了以下类型的有效值:

b - boolean
d - date
e - error
inlineStr - an inline string
n - number (the default)
s - a shared string str - a formula string

可以看到"n"代表一个number.

What is the best way to determine if a cell contains a numeric value?

从上面看来,您可以检查 Cell.DataTypeCellValues.NumberCell.DataType 来判断单元格是否包含数字,但这并不是那么简单- 最大的问题是日期。

日期的原始存储机制似乎是使用数字并依靠样式来知道该数字是否实际上是数字,或者该数字是否代表日期。

令人困惑的是,规范已更新为包含 Date 类型,但 并非所有日期都将使用日期类型 Date 类型表示单元格包含 ISO 8601 格式的日期,但对于将日期存储为具有正确样式的数字来说,这是完全有效的。例如,以下 XML 片段以 NumberDate 格式显示相同的日期(2017 年 2 月 1 日):

<sheetData>
    <row r="1" spans="1:1" x14ac:dyDescent="0.25">
        <c r="A1" s="1">
            <v>42767</v>
        </c>
    </row>
    <row r="2" spans="1:1" x14ac:dyDescent="0.25">
        <c r="A2" s="1" t="d">
            <v>2017-02-01</v>
        </c>
    </row>
</sheetData>

在 Excel 中打开时看起来像这样:

如果您需要区分日期和数字,那么您需要找到任何数字(空 Cell.DataTypeCellValues.NumberCell.DataType),然后检查它们的样式单元格以确保它们是数字而不是伪装成数字的日期。