java inputStream 读大 html 一次只读一个标签

java inputStream read large html only one tag at a time

我有一个 android 应用程序可以处理大型 html 文件(一整本书)。出于多种原因(性能、内存使用等),读取整个 html 个文件并不是一个好主意。

如果可能的话,我更喜欢一次读取一个标签的文件。我的 Html 文件看起来像这样

<main_tag>some text here</main_tag>
<main_tag><sub_tag>something</sub_tag><sub_tag>another thing</sub_tag><main_tag>

我的主要标签是 h1 ... h6 和 p。我想根据这个标签阅读我的文件。所有其他标签都包含在主标签中,应与主标签一起阅读。

知道我怎样才能做到这一点?性能在这里是一个真正的问题

你只需要使用 android xml pull api,阅读关于 org.xmlpull.v1.XmlPullParser[=11 的文档=]

尼拉夫