如何使用 apache-tika 从 excel 文件访问空白单元格

how to access blank cells from excel file using apache-tika

我正在使用 Apache-Tika-1.13 来读取和使用 excel 文件内容,我使用它很好,但是我在访问时遇到问题excel 包含空白单元格的文件。我需要访问那个空白单元格,Tika 是否提供了任何方法来访问最新版本的空白单元格?

没有。 Apache Tika 为各种文件格式提供一致、易于使用和简化的视图。因此,Tika 并非所有可能的底层库都是可能的。

如果您想对空白和缺失的单元格进行细粒度控制,您需要降级到 Apache POI,这是 Tika 用于 Excel 文件的库。然后,see the POI documentation on iterating over cells, including with missing/blank cell control如何做你想做的事