HTML 上标到纯文本 PHP

HTML Superscript to Plain Text with PHP

我正在努力通过条带化和替换所有 HTML 标签将 HTML 文档转换为纯文本并成功完成。但是我遇到过这种情况,我需要处理上标。我有这个 HTML 代码:

11,500 米²

(假设有上面显示的sup标签,但我不知道如何在这里显示它们) 我需要将它转换为纯文本,这样它就只有 11,500 平方米。我该怎么做?提前谢谢你。

由于ASCII中只有几个上标数字。

// replace all ... things to a power of 1
str_replace("<sup>1</sup>", "¹", $html)
// replace all squares
str_replace("<sup>2</sup>", "²", $html)
// replace all cubes
str_replace("<sup>3</sup>", "³", $html)
// for everything else use ^ notation
str_replace("<sup>", "^", $html)
// remove leftover closing sup tags
str_replace("</sup>", "", $html)

由于纯文本无法包含大多数字符,因此此解决方案将:

查找如下文本:一些文本其他

并输出:一些文本^其他